现在我们一起来玩一个元宇宙里的沉浸式角色扮演游戏——牧羊达人。在游戏里你的职业是牧羊人,游戏目标是从拥有10只羊开始,通过苦心经营成一代畜牧大佬。
开头不难,10只羊儿膘肥体壮、水草丰盛,稀里糊涂的两年过去了,你就拥有了1000只羊。事情慢慢起了变化,一个人放牧1000只羊无论如何都不再是吹着口哨就能完成的工作了,顺理成章地你雇佣了员工。
又三年过去了,养殖的品种扩张成了羊、牛、兔、猪。规模扩大的同时,利润的波动也随之变大,要想继续扩张就要控制利润,于是你在变幻莫测的农产品金融市场开始了金融交易。
田间地头的养殖团队,采购饲料、药品的保障团队,运输家畜的物流执行团队,以及西装革履的家畜实货贸易和套期保值的交易团队——他们合力让你成为了远近闻名的畜牧业新秀,你的产品畅销海内外,全球分支机构也如雨后春笋般建立。
荣耀袭来的同时,烦恼也悄悄降临。准确了解每天各个业务类型的统计信息变成了很头疼的事情,你的精英团队最主流的业务管理工具是Excel,这个被你认为是人类最伟大发明的工具。经年累月,师傅传徒弟的手工表格式多达60多种。
北大清华的小孩毕业到你这里,一开始都只能做点灯熬夜的表哥、表姐。60多张手工表,里面全是明细账,一笔笔的交易盈亏要想算清楚都不简单,专门负责汇总盈亏的团队遍及全球,规模达数十人之巨。
可惜的是,表里的数据错漏百出,没有人能保真、及时。针对同一个品类,可能不同的手工表有完全不同的名称。价格有错漏、信息不时丢失。
故事说到这里先暂停。这其实是我们团队在2022年初面临的一个真实案例,我们的客户希望能自动地提取60多张手工表里的原始数据,自动发现错漏,然后用闪电般的速度每天出一整套他们现在正在由人工完成组装的报表,数据源头要修改的话,所有报表用到这些数据的地方都要跟着变。
在此之前,客户的交易员们在常年的松散管理下,时不时给公司闯点祸,喜欢在期货市场“搏一搏,单车变摩托”。对此老板也颇为头疼,希望我们能借此机会实现实时监督各个投资组合下的头寸和盈亏、期货交易账号的保证金占用,快要超标的时候能发出警报,让他能及时知情、干预。
比案例情况更复杂的地方在于,除了60多套手工表,我们的客户还有若干系统,复杂局面催生的需求是简单而明确的,总结起来无非三件事:从犄角旮旯提取数据、出计算统计表、实现授权和预警。
这将是一套和传统的企业管理、业务执行完全不同的系统,按照IT术语,属于典型的“数据治理”类应用。对于企业而言,在大量解决实际的棘手问题的同时,并不需要所有员工长期配合、统一意见才能实施。
因缘际会,似乎这件事能引导我们通往一个被尘封很久的领域,无意中撞到了宝库的大门。数据治理和挖掘无疑是一个非常广大且有趣的市场,如果我们能给出一个很好的解决方法,那么除了当下牧羊达人的场景,似乎无数别的领域的类似问题都能被我们一起低成本攻克。
约一年时间,我们用压舱底的技术储备孵化出来了一个非常灵动的产品,我们叫他X-Ray,中文名叫思睿系统。比起既定目标,我们还实现了一套非常漂亮的数据洞察体系。
(BTW,我们的客户同时也是超大规模的国资贸易公司。他们通过思睿系统以极高的效率和很低的成本实现了国资委8号文和17号文的全部要求,完美解决存在多年的顽固困扰。)
思睿系统的适应能力、扩展能力、科研建模能力、图形化数据展现能力比起当下同类解决方案,都有了质的飞跃。更重要的是,它的实现成本被我们压缩到了极致,使用门槛也被我们降到了这个领域的竞争者无法比拟的程度。不论使用的是什么硬件、操作系统,只需要下载一个大约2G的Docker容器镜像,就能立刻在你的电脑上体验高品质的图形化思睿系统。
这是一件现实而且非常有意义的事情,数据治理不需要云山雾罩的吹,其核心是无比朴素的,无外乎找到数据、加工数据、创造价值、持续迭代。这个过程,为原本像烟雾一样消散的数据注入了内涵,更妙的是,数据的内涵不会衰减,会通过深加工、精加工而历久弥新。
思睿系统创造的价值并不虚:牧羊达人里能解决老板对真实战局的细节把握问题。放到运输领域,可以根据历史经验设计出时间最优、成本最优的货物和运力的匹配问题。软件外包行业能用它来解决项目管理、资源配置过程中的时间最优、成本最优的问题。
理论上来说,所有需要处理和分析大量数据的行业都会需要用到X-Ray(思睿系统),它事实上是一套帮助客户实现数据驱动决策的工具。例如金融行业,牧羊达人其实是贸易、金融行业的风险管理领域的用例。再比如科研行业、数据挖掘行业、制造业、制药业、软件外包业。
2023年我个人最大的收获之一其实是开始使用多邻国学习外语。我是一个语言爱好者,热衷于模仿,对于不同语种和文明有着浓厚的兴趣。迄今,我坚持学习西班牙语125天。
自我感觉学习语言的过程在多邻国里好像变成了看遥远的一幅油画,一开始它是一个小白点,一点点走近才发现细节慢慢被展开、呈现,足够近了才发现油画也是一个个的像素点堆叠的产物。
多邻国想了很多办法来鼓励我,吸引我每天上去学几课,从来没有让我背单词。我写这篇文章的时候却觉得好像自己不知不觉间已经默默地用肌肉记忆深刻地记住了不少的词汇。
我相信多邻国的课程安排是人类和AI共同努力的结果,同时他的课程在随着实际测量出来的教学效果进行着不断的迭代。兹举一例,首先多邻国并没有课文这种东西,每一课都由若干问题组成,或听、或说、或读、或写。生词会在里面反复重复,但是重复的过程中也有新词的加入,不知不觉间你就被动地记住了原本彻底的生词,并且能在句子中灵活运用。
这是不是像人类幼崽学习母语的过程呢?我们从小在学校教育体系中学习外语的方法其实是一个彻头彻尾的错误,一群并未真正掌握外语的人拍脑袋想了一套方法。然后让亿万小白跟着这个方法学、练,照这个方法,学出来了才是奇葩。多邻国用这一套内嵌在App里的方法论,在很短的时间内构建了全世界最大的语言学习社区,能留在上面学的人,基本上都是尝到甜头、长期受益的吧。
因为设计X-Ray的关系,我也学习了解了当下的数据治理行业现状。我深深感觉到,简单的问题被复杂化了。而被复杂化的原因,不外乎真正有价值的工具的缺位以及嫁接专业知识与系统的跨界者的缺位。就像多邻国一样,数据治理如果有了正确的工具和方法,其实不需要这么难,也不需要这么贵。
思睿系统是我们团队的又一次创业,是盈和网联公司的奠基石。我们对充满诱惑的数据行业满怀憧憬,踌躇满志,这样一片广博的蓝海,思睿系统一定会在历史上留下自己的名字。我们希望能通过它,帮助客户激活数据价值,从感性决策转变为数据驱动决策。