最近,OpenAI推出的ChatGPT火了。
60天月活破亿,迅速狂飙出圈。ChatGPT不仅刷爆了朋友圈,也炸醒了国内外的科技圈、创投圈。
有人说ChatGPT相当于AI版瓦特蒸汽机,有人说ChatGPT让我们看到AI的未来,连微软联合创始人比尔·盖茨都说,ChatGPT的意义不亚于计算机和互联网的诞生,英伟达CEO黄仁勋更盛赞其诞生堪比iPhone问世。
在国外,微软宣布将向OpenAI追加数十亿美元投资,旗下产品将全线整合ChatGPT;谷歌紧急推出Bard对标ChatGPT;苹果、亚马逊、Meta等海外科技巨头纷纷透露将积极布局AIGC、ChatGPT相关技术。
在国内,百度、阿里、腾讯、京东、网易、360、科大讯飞等相继官宣要做中文版ChatGPT;就连已退休三年的美团网创始人王慧文也在朋友圈官宣携5000万美元入坑......
ChatGPT是由OpenAI训练的一个大型语言模型,它使用了深度学习算法中的Transformer模型,通过对数十亿个语言文本进行学习,可以与人类进行自然对话,并尽可能准确地回答用户的问题。作为突破性的AIGC(人工智能生成内容)技术,ChatGPT为AI 行业带来了全新的想象力,由它引爆的“全球AI大战”火速拉开帷幕。
抢占先机,大模型是必由之路
值得注意的是,追赶ChatGPT的大厂,都在提及"大模型"。
百度文心一言将基于文心大模型推出;谷歌“Bard”由大模型LaMDA提供支持;360称自家布局ChatGPT类产品的优势在于数据和语料,在预训练大模型方面还存在短板。
出门问问CEO李志飞则表示,「2023年是AI大模型时代元年,此波变幅堪比2010年左右开始的移动互联网,听到最多的词是all in,许多人跃跃欲试要搞中国版的OpenAI/ChatGPT。如果把这个比作一场运动竞赛,那2023年Q1是报名阶段,目前的报名费是5000万美金起。」
可见,想要追上ChatGPT,离不开大模型。
但事实上,大模型并不是什么新鲜事物。
以下是「NLP领域大模型发展历程和重要突破」:
2017年,Google提出了Transformer架构,为大型模型奠定了基础。
2018年,Google推出基于Transformer架构的大型语言模型——BERT,成为当时最先进的自然语言处理模型。
2019年,OpenAI发布了语言模型GPT-2,该模型是一个大型的生成模型,能够自动生成高质量的文本,并且能够在多个NLP任务上实现零样本学习。
2020年,OpenAI发布了语言模型GPT-3,该模型是迄今为止最大的自然语言处理模型,拥有1750亿个参数。
2022年底,OpenAI发布基于GPT-3.5训练而成的ChatGPT,引发行业关注。
2017年,谷歌提出的Transformer架构为大语言模型发展奠定了基础,大模型由来已久。
很多人会有疑问,既然ChatGPT的核心架构Transformer最初是由谷歌提出的,并且谷歌在大模型技术上的积累可以说不弱于OpenAI,他们也不缺算力和数据,为什么会被ChatGPT打的措手不及呢?
这就必须来说说在算法和算力都是现成的情况下,ChatGPT在数据和反馈策略上的精妙之处。
RLHF基于人类反馈的强化学习,ChatGPT大力出奇迹
对于大模型训练来说,数据是其根本。但是想要训练一个类似ChatGPT的大模型,有足够的数据还不够,还需要有效的数据标注策略。
ChatGPT能够突破难点大力出奇迹的核心就在于:Open AI在ChatGPT训练过程中设计了一套精巧的数据反馈链路策略——Reinforcement Learning with Human Feedback (RLHF,基于人类反馈的强化学习)。
可以这样理解,此前的大模型是在海量数据上自由奔跑,因为见识多,所以能预测,但会乱说话,有风险。RLHF数据反馈策略的加入,让ChatGPT在“自由奔跑”的基础上,用少量数据学会了遵循人的指令,揣摩人的喜好,不乱说话,说有用的话。
结语
可以预见,未来几年的AI大模型竞争将非常激烈,还未入局的玩家,或将面临淘汰。我们期待中国版ChatGPT的诞生,也将助力AI大模型的快速落地和应用。
ChatGPT等通用语言大模型一直被理解为“三高”,即“算力要求高”、“数据要求高”、“人才要求高”。实际上,我们发现通过良好的反馈闭环系统和数据策略设计,仅需要三十分之一的模型大小就可以实现甚至超越GPT-3的1750亿模型参数量的模型效果。
我们在语言模型和人机交互方面的丰富经验,积累下来的不仅仅是标注高质量数据的能力,更是数据策略的设计能力,以及不断打磨并符合科研需求的一整套数据闭环产品。
在大模型领域,我们不仅仅需要通用语言模型能够解决聊天、问答、信息检索等需求,更会在客服、金融、出行、工业制造、生物医药、农业等垂直领域对大模型有更加明确并可预期的落地效果。希望星尘数据在这方面积累的经验和产品,能够助力客户在各个领域快速打磨出一套够用、好用的交互体验算法,快速建立起行业领先优势。
如果您正在训练类似ChatGPT的大语言模型,需要优质的语料库资源和RLHF基于人类反馈的强化学习数据策略,我们将竭诚为您服务。
*文中部分图片来自网络
-
2025-10-05数据标注·AI背后的百亿美元市场【未来投...3月25日,保定市智能网联汽车产业迎重磅盛事!由保定市科学技术局指导,保定・中关村创新中心与北京物联网智能技术应用协会联合主办的 "智网世界、链通保定 - 智能网联车" 专场赛,在保定・中关村创新中心火热开启。详情
-
2025-10-05从河南到北京的智慧对话!尚跃智能 × 四维图新同台!路演现场高光记录3月25日,保定市智能网联汽车产业迎重磅盛事!由保定市科学技术局指导,保定・中关村创新中心与北京物联网智能技术应用协会联合主办的 "智网世界、链通保定 - 智能网联车" 专场赛,在保定・中关村创新中心火热开启。详情
-
2026-01-12喜报!尚跃智能入选创业邦榜单,正式升级为高质量数据集构建与模型训练服务商国内 AI 数据服务领域标杆企业 —— 尚跃智能科技,凭借在数据智能领域的深度积淀与创新实践,成功入选创业邦「2025 值得关注的数据应用创新企业榜单」!详情
-
2026-01-15从欧洲交流会看数据标注的全球新航道3月14日,由36氪主办的"出海欧洲交流会暨圣帕特里克节庆祝活动"成功举行,活动特邀跨国企业、海内外领军企业、北爱尔兰投资发展署等共同参与详情
-
2026-01-12AI 赋能金融创新!尚跃智能智能投顾智能体斩获 2025 讯飞 1024 开发者节季军在 AI 技术重构金融服务生态的浪潮中,尚跃智能科技河南有限公司再添重磅荣誉 —— 其自主研发的 “AI 技术驱动智能投顾智能体”,在2025 科大讯飞全球 1024 开发者节 AI 开发者大赛中脱颖而出,从17 个国家、325 座城市的 36898 支参赛团队中突围,最终斩获季军殊荣,彰显了国产金融科技企业的硬核技术实力。详情
-
2026-01-15自动驾驶L4、L5狂飙,数据标注迎来黄金机遇?自动驾驶技术正逐步改变我们的出行方式,L4、L5 级自动驾驶的发展更是带来了全新的可能。详情