当前所在位置:首页 > 股票配资首选

前阿里云高管吴翰清再创业,如何解决大模型幻觉、打破数据垄断?

6976

2024-05-12 【 字体:

在杭州EFC欧洲中心,一栋离阿里巴巴EFC园区步行五分钟的写字楼里,驻扎着许多年轻的创业公司,它们的创始人许多出自阿里巴巴。

科技行业刚刚走过了特殊的一年,大模型带来的“智能涌现”让许多人看到了人工智能的更多可能性。2023年年初,人工智能科学家、阿里副总裁贾扬清也宣布离职,投身AI创业,阿里之外,字节、腾讯、百度等大厂均有技术大牛出走创业,从对技术发展、应用的未来判断和预测中,他们寻找着机遇、创新以及其中的新商机。

吴翰清是其中备受瞩目的创业者之一,他的上一个身份是阿里云的道哥(花名),2005年加入阿里,是阿里巴巴集团的第二位安全工程师,创建了阿里巴巴、淘宝、支付宝的安全体系,也是阿里云的初创团队成员。2023年5月,他从阿里云离开,联合另两位创始人以及 13 名初创团队创立了一家人工智能公司KMind。他们选择了“个人AI计算机”,要让个人AI计算机补齐大模型和AI应用间“缺失的一环”。

科技行业在大模型赛道“狂飙”的一年过去了,在接受第一财经采访时,吴翰清谈到了他所观察到的AI产业现阶段存在的问题,对数据收益被大公司垄断的不认可,以及在AI、云计算发展新阶段下,个人AI计算机诞生、发展的可能性。

“普通人对AI失去信心”

“很多企业非常期待大模型的能力。但是他们真正投入之后,会发现只能用来打一个样板房做一个宣传,没办法去切入到实际的生产流程里面去创造实用价值。”谈到ChatGPT发布以来这一年行业的状态,吴翰清看到了许多问题。

2023年7月,KMind推出了一款面向C端的AIGC 效率工具“魁星智能助手”,受到市场欢迎,吴翰清打开手机企业微信向记者证明:推出3个月时,该应用已有了10万用户。“但最后发现用户流失率非常高。”他坦诚道出了产品后来的困境。

难以解决的,一个是大模型幻觉的问题,当用户提出一些请求时,大模型有时会给出一些与事实不符的回答,甚至胡编乱造的错误回答,给应用带来了问题。

另一个是AIGC产品缺乏精确控制的问题。“比如像我妈这种完全不懂什么叫AI的普通用户,她喜欢天天拍照做相册,我跟她说可以用AIGC产品来做,自动化生成一个相册。她做完之后想配个背景音乐,然后她跟AI说你把这个背景音乐给换成《茉莉花》,然后AI就蒙圈了。”吴翰清进一步阐释:“这个时候你就会发现普通人就会对AI失去信心,因为他真的是把它当成一个人在对待,这些问题的出现导致今天我们从应用角度来说,大模型缺乏所谓的最后一公里,它离真正创造实用价值是有距离的。”

《2023—2024年中国人工智能计算力发展评估报告》显示,截至2023年10月,中国已累计发布两百余个大模型。与之相关的AIGC应用更是不计其数。但大模型幻觉、缺乏精确控制与实际应用场景,仍是这个行业普遍存在的问题。

“举个典型例子,大家都在谈AIGC,但我一直跟团队说不要提AIGC这个概念,它完全把事情说歪了或者说小了。什么叫AIGC?那一定是创造,就是文生图、文生文、文生短视频,这是大家非常熟悉的。但我们知道(实际应用中)修改的需求是比生成的需求要大10倍以上的,那谁在做修改呢?没有人在做修改。”吴翰清观察到,目前所有的大模型产品无论哪种类型,都只能生成第一遍结果,当用户试图去修改时,大模型只会重新生成一遍,再生成的基本要素全部变掉,由于这些问题的存在,用户很难真正用AIGC应用去解决问题。

回答“《西游记》里有几个孙悟空”

“这些问题促使我们思考,到底应该怎样回到一个正确的轨道上、去坚持做正确的事情。”AIGC热闹浪潮下,吴翰清带着许多问题和思考离开阿里云开始了再创业,“一定要解决一个别人都解决不了的问题,然后才能证明这件事情是有必要的。”

吴翰清将AIGC的许多问题归因于产业链中间环节的缺失。他认为大模型是CPU,而无论是ToB还是ToC的AI应用,都需要一个中间环节来将其与大模型联系起来,不可能指望应用直接跑在CPU上。而在他的蓝图里,个人AI计算机的创造或发明,将是在AI技术变革中使产业链完整、真正让大模型成为CPU支撑所有AI应用创造实用价值的一种解法。

(受访者供图,图中为吴翰清)

“在Web端时代,比尔盖茨基于个人计算机推出了Windows的操作系统,提出了软件的概念。在移动端时代,苹果发明了智能手机,并在2008年推出了APP Store,然后才有了APP概念。”吴翰清谈到了那些科技界过往跨时代意义的发明,在他来看,来到AI互联网时代,人们也需要个人计算机及AI时代新的程序开发形态来定义、修正、约束AI的动作,AI的能力、行为和性格也将在未来具备可塑性和成长性,他将这种个人AI计算机上的新的算法程序定义为“ACT”。在KMind 推出的个人AI计算机的架构kOS里,程序员可以开发自定义的“ACT”,用于定义AI的某种自主行为。在未来,当AI成熟到可使用某种形式化语言来自动编程时,普通用户也可以实现使用自然语言和个人AI计算机交互。

基于此,2023年7月,KMind 正式发布了自己的品牌和产品:半个宇宙(hikOS),希望提供一个由kOS驱动的个人AI计算机给所有普通用户使用,目前,KMind已推出了由kOS驱动的个人智能助理“星伴”,吴翰清介绍,与大部分公司推出的“可调用”的AI不同,星伴具备的可编程的能力,人们可以通过编写ACT来定义星伴的能力和行为,而星伴的个性化知识、经验、记忆、性格将被保存在“星魂”,将成为未来用户宝贵的数字资产。

“可编程”的AI在吴翰清的创业理念中显得尤为重要,在他的讲述中,kOS尝试在统一神经网络和高级编程语言这两者,或者从更高的层面来说,尝试着用同一个系统来统一掉连接主义和符号主义,让它兼具神经网络的泛化能力,同时又能够保留高级编程语言的逻辑推理能力,也就是精确控制能力。

这同样可以回到大模型幻觉和缺乏精确控制能力的问题思考上。“《西游记》里面有几个孙悟空?”吴翰清抛出了这个问题。据吴翰清观察,《西游记》里提及了几次“孙悟空”是目前市面上所有大模型都无法回答的问题,他有时是“大圣”,有时是“孙行者”,还有时是代词“你我他”,大模型无法计算,时常会给出胡言乱语的答案。但对传统的程序员来说,这压根不是一个问题,当他用编程、逻辑推理去解决时,这个问题很容易得到确定答案。

“工业界的人被学界给带歪了,学术界的人一直在追求让神经网络具备逻辑推理能力,而工业界应该把AIGC当作一个应用问题投入到生产以及扩大规模。”吴翰清表示,通过kOS对神经网络和高级编程语言两者的统一和模拟人的思考过程的符合控制的设计思想,以及通过数据的脱水和数据的浸泡产出结构化数据的符合信息论的思想,未来,kOS能够更好地解决大模型的幻觉和精度问题。

如何避免“数据垄断”

“数据垄断”的问题同样是吴翰清对互联网现状的重要观察之一。

他认为,当今互联网最深层次的主要矛盾在于:“信息聚集导致的数据垄断”和“人们对自由、开放、 共享、 平等的网络环境的向往”之间的矛盾。他在个人公众平台写道:互联网带来便利的信息访问,但也导致了信息在某些超级节点(如大型互联网公司)的聚集,进而形成了数据垄断。这种模式导致了广告商业模式的出现,使得大型互联网公司通过垄断数据实现盈利。

在他看来,数据垄断的弊端在于用户贡献了数据,收益却被大公司垄断,这造成了数据税的问题,抬高了商品售价。同时,数据垄断也带来了互联网的割裂,使得互联网变得地盘化,降低了用户效率和体验。垄断还瓦解了互联网的自由属性,使得小的个体难以在互联网上出头,而大型公司则失去进取动力,导致腐朽。

在推动技术进步的同时,做一家避免数据垄断、“不作恶”的公司成为吴翰清和KMind的目标之一。“所有的大模型都在走OpenAI的道路,但我们没有尝试着去走,这里面有一个很重要的区别,如果这个公司的商业模式是广告,很难避免自己不作恶。”

吴翰清认为,数据垄断的矛盾首先可以通过调节网络结构来制衡资本的无序扩张。将互联网设计成一个类似于人类社会关系网络的模型, 构建一个更加公平的、去中心化的,局域化的网络,再通过长程连接把各个局域连接起来,避免了信息超级节点的出现。同时通过新型技术架构改变互联网的信息流动方向,从而消除信息聚集。

个人AI计算机可能成为未来数据技术革命的一部分,同时,吴翰清强调,KMind在成立之初就宣布会将“半个宇宙”里信息的推荐和检索算法开源,由一个开源社区来维护,“如果有一天半个宇宙居然想要把这些闭源掉,那我也号召所有半个宇宙的居民来推翻它,因为从那一天可能就是它作恶的开始,它又开始从尝试不垄断数据走向了数据垄断。”吴翰清承诺,未来用户数据会放在“半个宇宙”的世界里,但KMind不会通过用户的数据训练自己的模型,也不会做一个拥有所有常识的AI出来,然后去收费。

这也指向了未来大模型和AIGC商业化的另一条路径。吴翰清表示,目前大部分大模型都尝试通过大模型拥有的无比巨大的知识和常识来收费,要么直接收费,要么通过广告收费,但KMind要卖的是算力。“半个宇宙”提供的是算力,程序员进来提供的是算法,用户提供的数据,所以数据是归用户的。用户得到了数据,创造了价值,程序员得到了他写的算法创造的价值,半个宇宙得到提供算力的价值。

在AI互联网时代的浪潮滚滚而来时,“一个非常良好的产业分工”是被吴翰清所期待和强调的。在AI技术革命及其可能带来的商业狂欢里,吴翰清警惕着数据垄断与“赢家通吃”,“我们相信技术可能给人带来幸福。”他说。

举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。 文章作者

陈杨园

关键字

阿里云大模型AIGC

相关阅读 阿里云发布云原生数据库PolarDB新版本

阿里云发布云原生数据库PolarDB新版本

01-17 14:44 2023国内大语言模型发展盘点(三)—发展难点与未来展望

在全球范围内,大型语言模型的发展正在迅速推进。国内已经具备了多个具有先进技术与创新能力的额模型,但在数据处理、技术标准以及隐私问题等方面仍然存在不容忽视的障碍。本文将深入分析中国在大型语言模型发展中所遇到的主要瓶颈,并尝试提出针对性的政策建议,以期推动国内在该领域的持续发展。

01-16 01:40 2023国内大模型发展情况盘点(二)--中美大模型情况发展比较

截止2023年5月,中国已成功发布超过79个拥有10亿以上参数的基础大语言模型,相同等级模型下,美国发布数量达到100个。全球范围内累计推出的10亿以上参数大语言模型总数为202个,其中中美两国所发布的模型总数占比近90%。相关数据体现国内于大型语言模型开发领域已跻身领先行列,本文将通过中美大型语言模型发展比较深入了解发展现状。

01-14 23:06 2023年国内大模型发展盘点(一)——大模型发展趋势

“十四五”期间,国家出台了针对人工智能的未来发展相关指导方案和激励政策,涵盖“新型基础设施”建设、人工智能标准化与法规以及AI安全体系建设等。过去的2023年作为承上启下之年,如何总结评估前期成果并调整优化策略将成为规划实施的重要一环。而大语言模型作为人工智能领域最引人注目的成果之一,近年来已经经历了迅速崛起的历程,2020年Open AI GPT-3模型的发布更是极大推动了公众对于大语言模型的关注度。本系列文章将分别回顾2023年国内大模型发展重要趋势,比对中美大模型发展水平明确自身缺陷及劣势,并针对未来国内大模型发展给出针对性建议。本文将概括2023年国内大模型发展重点趋势,分别从模型规模、应用场景、技术创新、跨模态大模型以及产业化角度介绍年度发展。

01-14 22:55 探索智能化时代新机遇,北京加快建设人工智能创新策源地——对北京市人工智能及相关产业发展的评述

在AI技术全球快速发展的背景下,北京作为中国的科技和创新中心,其在人工智能领域的进展不仅展示了技术创新的实力,也是推动地区经济增长、提升国际竞争力的关键。尤其是,北京具有国内领先的人工智能科技资源、人才和产业发展优势,目前已形成基本完整的人工智能产业链条。近年来,北京先后发布《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023—2025年)》《北京市促进通用人工智能创新发展的若干措施》,围绕应用场景打造、算力基础设施建设、数据开放共享等方面,多维联动、多措并举推动人工智能占先发展,持续提升全球影响力。为此,本文聚焦北京人工智能产业发展,深入分析和总结2023年北京人工智能及相关产业的重要成果,并展望2024年的发展趋势以及重点关注事项,对北京市人工智能及相关产业发展进行评述分析。

01-08 01:07 一财最热 点击关闭

阅读全文
相关推荐

主力配资炒股 ,一财社论:全球最庞大科技人力投入应创造更大发展动能

主力配资炒股 ,一财社论:全球最庞大科技人力投入应创造更大发展动能
主力配资炒股 ,一财社论:全球最庞大科技人力投入应创造更大发展动能主力配资炒股...

,2月22日富国中证同业存单AAA指数7天持有净值10560元,增长001%

,2月22日富国中证同业存单AAA指数7天持有净值10560元,增长001%
 ,2月22日富国中证同业存单AAA指数7天持有净值10560元,增长001%...

沪深B股市场收盘:B股指数上涨029% 成份B指上涨111%

沪深B股市场收盘:B股指数上涨029% 成份B指上涨111%

“双黄”预警!广东西部局地发生山洪灾害可能性较大

“双黄”预警!广东西部局地发生山洪灾害可能性较大
5月18日18时,中央气象台发布暴雨黄色预警,水利部和中国气象局联合发布黄色山洪...

数字人民币“不见外”!境外人士来华可在超百万商户扫码消费

数字人民币“不见外”!境外人士来华可在超百万商户扫码消费
4月24日,据南方+记者获悉,在中国人民银行数字货币研究所指导下,由财付通与微众...

南农晨读 甜蜜镇宁 与“李”有约

南农晨读  甜蜜镇宁 与“李”有约
【今日关注】 端午假期首日,广东4A级及以上景区接待游客173.9万人次 记...

黄金暴跌,2350区域多空大决战,冲高下跌主旋律!

黄金暴跌,2350区域多空大决战,冲高下跌主旋律!
止损永远是对的,错了也对;死扛永远是错的,对了也错。横批:止损无条件!如果没有交...

6月17日投资避雷针:无人机人气股突发利空 全资子公司被禁止参加全军物资工程服务采购

6月17日投资避雷针:无人机人气股突发利空 全资子公司被禁止参加全军物资工程服务采购
导读:财联社6月17日投资避雷针,近日,A股及海外市场潜在风险事件如下。国内经济...

金界传奇:黄金现价2363-2368继续空!

金界传奇:黄金现价2363-2368继续空!
黄金早盘高点还是没能守住,行情到达了早盘预期的位置,现在多头已是强弩之末,后半夜...

贝泰妮:公司已于2023年布局海外市场,在泰国曼谷建立了东南亚业务总部

贝泰妮:公司已于2023年布局海外市场,在泰国曼谷建立了东南亚业务总部
证券之星消息,贝泰妮(300957)06月06日在投资者关系平台上答复投资者关心...