文章转载来源:AIcore
原文来源:脑极体
“您认为AI公司在昆明,跟北上广相比有什么优势?”
“我觉得昆明就是中国的硅谷,气候特别好。”
这段对话,是在一次人工智能主题座谈会上真实发生的。
经常参加这类交流活动的朋友可能会懂,这类问题一般在“递话”,给受访人一个“安利”自家的产品、技术、差异化价值的由头。所以当现场有人抛出这个问题时,我也做好了听到一堆PR公关辞令的准备。
没想到,这位昆明某AI服务商、数据科技公司的技术负责人,给出的答案是大家都没有设想过的。但这种“意料之外”,展现出在“北上广”这类大城市少见到的“地气”。
活动结束后,我和这位技术负责人单独聊了聊,又发现了一种“意料之外”。
他们公司也在做大模型,用的是开源Llama架构+国产算力,经由私有数据微调,为云南游客提供线上问答服务。
你可能会问,AI模型都不是自己从底层代码写上来的,有什么差异化竞争力?实际上并不是大家想的那么简单,只要调用API再用数据跑一遍就行了,他们在模型之外做的工作非常多且扎实。
比如,他们服务的一些云南本地企业,可能连数据标注、数据治理、数据工具链等基础概念都不知道,高质量数据集、文档也没有,想要训练专有AI模型,就得从自己组建“标注组”开始。因为客户都很在意数据隐私,所以一个组的项目做完就要解散,标注人才就流失了,下次再重新建组。今天的AI落地,依然高度依赖“有多少人工就有多少智能”。
当我们走到三、四线城市,发现这里的AI公司和开发者,对AI的认知和做法,都有很大的不同。
用这些“意料之外”,我们可以大概拼出一张拼图,上面写着:在小城市做AI,究竟是一种什么体验。
小城做AI如同养“中华田园猫”
雄踞全球科技资本和人才的硅谷,是OpenAI、DeepMind等顶级AI机构生长的土壤。那么,中国三、四线小城市的一方水土,会孕育出怎样的AI呢?
在云南,我见到了两个AI服务商,以及不少开发了行业AI应用的实体企业,他们的AI模型有一个共同点:都使用通用大模型作为基座。比如基于开源Llama 2架构,加上自有数据、客户数据进行精调,底层代码都不是自己从头写上来的。
站在巨人的肩膀上,是目前在小城市做AI的最优解。
当地的AI开发者告诉我,首先,他们测试了市面上主流的开源大模型和闭源大模型,最终选择了Llama,原因是模型在业务场景下的表现好,而且生态够丰富,社区资源多,配套工具成熟,这给他们的后续训练和开发减少了很多难度。
此外,身在三、四线城市的AI公司,往往并没有足够的预算、算力、工程人才去从头训练一个新的大模型,加入开源社区或闭源生态是最现实的选择。一位技术负责人说,他们没法像大厂那样囤上几千几万张英伟达算力卡,加上N卡价格疯涨,所以用的是国产算力,虽然需要解决跟CUDA的兼容性问题,但能满足他们的需求,是目前比较有性价比的选择。
另外,他们在本地垂类赛道,数据和工程是核心竞争力。这些三、四线城市的AI公司,没有股价压力,也不需要给投资人PR,专注于某一个非常小的垂类场景,一般也是大厂看不上、不会去碰的小市场,依靠私有数据积累和工程化交付的能力,就能建立起商业模式。
因为很多落地场景,只有在当地深入了解行业才能发现。
比如一个AI公司,基于开源大模型+自有旅游数据开发的民宿大模型,已经在云南大理的民宿落地了。而将大模型的对话能力,打造成“24小时AI管家”,这个灵感来自民宿会遇到社恐的游客,或者不希望暴露隐私,不想因为WiFi密码等小事麻烦服务人员,管家的介入很难做到恰到好处,让游客住的不够舒适自在。而大模型出来之后,就在旅客和管家之间,多了一个AI交互的缓冲地带,一些小问题通过AI管家就能解决,需要人工服务时随叫随到,这样就很好地解决了旅客的顾虑。
目前,该公司的AI大模型服务,主打的就是可落地、支持私有化,目前覆盖了文旅、工业、政务等场景,业务营收有70%以上来自大型企业的数智化。
实话说,很多一线城市的AI创业公司、高校科研院所打造的大模型,都未必能产生这样的落地能力和经济价值。
总的来说,我的感受是,三、四线城市的技术从业者,上来就是从场景里找机会,找跟AI的结合点,反而更容易出效果。
一位开发者朋友是这样说的,“搞AI就像养猫,科学家们和企业会养聪明的品种猫,这跟我没什么关系,我喜欢养小猫串串,把AI领域跟人文艺术领域结合起来,这个品种你没见过吧”。
将通用大模型的“品种猫”跟本地场景、本土需求相结合,进行“杂交”,养出一只只“混血小猫”,这些垂类AI应用,就像中华田园猫,可能是大厂和科技媒体人不太关注的,却沐浴着云南得天独厚的阳光,真实而有生命力地成长着。
在小城市做AI的可能性
在交流活动中,有好几个媒体人都询问,在云南做AI有哪些阻碍和挑战。真正的问题,似乎在意料之外,又在情理之中。
所谓意料之外,是很多问题已经在被积极解决了。
比如基础设施,在大家的印象中,三、四线城市的数字基础设施发展比较晚,发展AI的资源禀赋比较薄弱。实际上,基础设施在当地越来越不成为问题。
拿算力来说,云南的算力资源已经可以满足当地AI的开发需求。当地工作人员告诉我们,由于电价便宜,气候条件好,所以云南很适合发展AI人工智能数据中心,前文提到的民宿大模型,就是在昆明人工智能计算中心上进行训练的,采用的国产算力。当地交通领域的数据中心工作人员也提到,该行业数据中心已经完成了60%的国产替代率。
至于数据,参加交流活动的两家AI服务商,此前都是数据服务提供商。其中一个成立于2018年,在2020年的时候就形成了第一版数据解决方案,和一、二线的大厂签订了合作关系,积累了大量的数据资源和工程经验。而算法,如前所说,依托全球领先的开源模型和社区,当地AI公司也可以快速上手开发。
那么,当地AI发展的真正约束条件是什么呢?
一是远离产业带。行业AI解决方案包含了多个环节和生产链条,很多小城市还没有建立起产业集聚优势,导致生产环节中存在断点。一位昆明当地的AI服务商提到,客户的私有化部署,往往需要单独成立标注组,项目完成就解散了,人才就要流失。而他们跟省外的标注公司合作,有的要收取加盟费,有的对团队规模有要求,必须达到100人以上,这就给他们的项目增加了不少成本。
二是缺人。既然到外省找人很麻烦,那么找本地人才呢?答案就是当地没有那么多AI人才。那一场交流活动中,也有云南当地的AI产业学院老师参加,对方提到,该学院今年招收了200名人工智能专业的本科生。现场一家AI公司表示:“200个?根本不够用啊。”
除了人数少,由于人工智能是一个新兴专业,当地也还在探索培养方案,有老师提到,目前AI教学还存在跟应用领域不够贴近的问题,企业提供的AI实训平台不符合教学、科研的需求,学校只能自己开发。
如何解决上述困境?我也在当地看到了一种跟开源文化有点类似的产业集群创新模式,那就是“抱团取暖”。
一家本地的数据服务公司,将自己打造的数据标注、数据治理、数据探源等工具链,开源出来,丰富区域内的数据资源。此外,依托昆明人工智能计算中心,当地也在陆续开展师资培训、工程师培训等人才培养项目,打通“学练训赛业”,推动产学研用的融合。
远离了“北上广”和“龙头企业”的三、四线城市,由于AI产业链的零星聚集,反而跟彼此产生了格外强的引力,特别积极地希望贡献出自己的一份力量。
产业AI的“面子”和“里子”
说到这里,你可能会问,那三、四线城市的AI落地情况究竟怎么样?跟当地产业相结合的广度和深度如何呢?
我可以分享两个真实的见闻故事:
一个是“面子”。在中国-老挝的边境城市,当地工作人员带我们参观了位于火车站附近的“智慧展示中心”。我们发现,这个展示中心的作用,确实是“展示”,我们到大屏幕前观看完两部宣传片,就没能再深入了。
另一个是“里子”。当我们走到日常运行的货车检查站,一个工作人员对着镜头侃侃而谈,告诉我们5G+AI的应用如何落地,让货车一站式通关,避免了层层卡验,将每辆车的平均通关时间从8分钟缩短到4分钟。从技术规划到落地效果,讲的非常清晰,带着一种很了解一线实际情况才有的挥洒自如。
对此,不同的人可能会有不同的解读角度。
AI应该乐观吗?好像是的,它已经抵达了最遥远的边境线,在n线城市落地。AI应该悲观吗?也有点道理,有效的AI应用似乎就那么多,作为“典型案例”存在,而如果没有AI场景的遍地开花,那么建好的AI基础设施发挥的作用,确实就是摆在那里,作为“展示”。
今天,三、四线城市的AI探索,处于一个智能化需求特别多、特别分散的阶段,只能一个场景一个场景地渗透。而这也是本地AI企业和开发者的机会,也有越来越多的人看到了这些地方存在的无数个被AI改变的可能性。
在当地走访时,本地AI企业提到一句话:通过一个场景,探索出一些模式,应用到整个行业,一个个场景的智能化,拼起来就是整个行业的智能化。
他们确实也是这样做的。
这些微小而分散的需求,是AI大厂和巨头不愿意触碰,做了也投入回报比很低的场景,被当地企业一个接一个地解决着。
比如云南开发出的越南语、老挝语、缅甸语、柬埔寨语、泰语等南亚东南亚语言的扫描笔、AI翻译机;帮助企业无需写字段调用API,就能根据不同的使用场景,比如经营分析会、领导参观汇报、财务数据上报等,实时生成任意需求BI的垂类大模型;为麻醉科提供高效智能排班服务的大模型等。
大模型狂奔这一年,已经从价值炒作阶段进入到价值沉淀阶段,有大模型厂商提出了“不作诗、只做事”的理念。那么,谁来做事呢?
这些在小城市做AI的人,用一个个场景的拼图,拼出了大模型“有用”的答案。而AI的小城故事,还会在这片土地一直讲下去。