南京市创新投资集团有限责任公司
 苏ICP备19030249号-1    网站建设:中企动力 南京

了不起的青年·创投实录|风语智能:瞄准开源情报新蓝海,实现大语言模型的商业化

分类:
了不起的青年
2024/05/13 09:13

  2023年ChatGPT的问世被认为是人类科技发展史上重要的里程碑事件,短短几个月里席卷全球,速度之快超出想象,也由此带动包括AI算法、大模型和大数据等的迅猛发展。

  作为有着突出处理大规模数据集能力的自然语言处理(NLP)大模型(简称“大语言模型”),便随着ChatGPT的横空出世走向全新的高度,市场呈现出产品和应用百花齐放的盛况,并通过与各行各业的应用结合,探索能够有效落地的商业模式。其中开源情报便是因大语言模型的引入迎来重大变革和进步、并与人工智能融合形成商业闭环的行业。这一行业模式的探索者者是来自南京大学电子科学与工程学院的博士生,南京风语智能信息技术有限公司(以下简称“风语智能”)创始人路思远。

 

缘起科研项目,思考商业前景

 

  风语智能是一家专注于运用先进人工智能技术开展开源情报分析的公司,创办于2023年9月,目前已获得南京市创新投资集团、奇迹创坛的两轮投资。

  “大三时开始我就跟随芯片设计和人工智能领域里的国际顶尖专家王中风教授从事新一代人工智能技术,特别是深度学习加速器设计的研究。考上研究生之后,我也正式加入了王教授领衔的集成电路与智能系统(ICAIS)实验室,主攻语音识别和自然语言处理技术(NLP),有幸成为国内最早关注大模型技术研究者中的一员。”路思远在介绍自己求学历程时展现出对于行业的激动与热情,当2017年Google颠覆性地提出基于自注意力机制的神经网络结构——Transformer架构时,路思远在和实验室老师同学们的交流中,就认识到这一架构在深度学习领域具备颠覆性的潜质。相比传统深度神经网络,Transformer更加高效与简洁,如果与医疗、金融、情报等行业结合,又可以进一步推动相关技术的发展,大大提升信息处理和决策效率。

  随着对技术的不断挖掘与研究,路思远开始对高效支持Transformer模型计算的硬件架构 “发起挑战”,不断地通过研发平衡计算效率、存储访问、能效比和灵活性等多方面需求,以适应不断发展的AI模型和技术趋势。读博期间,他发表了第一篇Transformer硬件架构工作论文,并获得2020年IEEE片上系统年会的最佳论文奖,也由此成为了国际上最早设计出Transformer硬件架构人员之一。

  2022年11月,当搭载了GPT3.5的ChatGPT横空出世,凭借逼真的自然语言交互与多场景内容生成能力一鸣惊人时,也让路思远对大模型和商业相结合的前景有了更多期待。他坦言:“我一直有创业的梦想和念头,也希望能够抓住大模型技术迅速发展的风口,让自己的研究能够产生商业价值。”在王中风教授的支持下,他与深度学习数据压缩方向的施禹伯博士组成团队,从系统、算法、硬件三个维度入手,解决最新深度之习NLP算法部署难、落地难的问题,并希望可以实现RiSE架构和NPU部署工具链的自主设计,在研发过程中找到竞争优势和商业转化机遇。

 

宁聚计划留人才,校地融合促发展

 

  2023年3月,在导师王中风教授和南京大学国际创新创业学院的支持下,风语智能在南京大学大学生创业园正式成立。

  “‘风’象征着流动和快速传播,‘语’则与语言、交流相联,以‘风语智能’命名公司,是希望公司的产品可以像风一样高效且自然流畅地传递和处理信息。所以我们集中精力去做研发,但是很快也发现初创公司资金、资源、人才是不得不面对的现实问题。”虽然是连续创业者,但是当真正作为创始人肩负公司的发展责任后,路思远不得不思考和钻研得更多一些。随着宁聚计划的深入贯彻落实,更多青年创客选择留宁展业。为了获得更多的支持与关注,路思远决定携手团队参加了由市人社局主办、南京市创新投资集团支持的2023年“赢在南京”青年大学生创新创业大赛。经过激烈的厮杀拼搏,路思远的“风语智能”从3500多个创业项目脱颖而出,获得评委一致认可,斩获了这届大赛的一等奖桂冠,凭此得到了南京市创新投资集团天使基金的专项资金支持与财政奖励,“南京大学在创业场地上、创业教育上给了我们很多支持,同事创投集团的天使投资与财政补助在资金上给与我们助力,创投集团专业的投后孵化服务,也让我们在思考产品与市场间关系上有了更多的专业助力,让我们的创业之路走的更稳更安心。”同年,路思远向知名AI天使投资机构奇绩创坛提交了围绕语言大模型应用的创业项目申请,得到创始人陆奇博士青睐,成为2023年春季创业营60个入选项目之一,自此迈开市场化融资的第一步。

 

 

瞄准开源情报,聚焦打造高性能产品

 

  2023年4月,贝哲斯咨询对外发布了《2023-2029年中国开源情报行业市场发展趋势调研报告》,报告内容覆盖行业概况、上下游情况、行业头部企业,主要竞争力产品等,体现出开源情报对政企单位策略部署、战略制定、趋势判断、风险预知等的重要意义。

  路思远和团队敏锐地捕捉到开源情报行业的发展前景以及在大量商业情报检测、搜集和分析过程中,对数据高效精准获得、抓取、交互和大量文本快速总结的需求。“目前开源情报业持续以6.23%的CAGR增长,预计2028年市场规模可望达到395.89亿元,对于人工智能应用落地而言,这是一片具有极大发展空间且与大语言模型优势高度匹配的蓝海市场。所以我们在产品研发和市场开拓上做了大胆地尝试。”

  深度思考,谋定而动,风语智能聚焦开源情报业,立足Transformer神经网络高性能计算、深耕深度学习数据压缩等领域,将AI大模型在文字工作方面的优势充分发挥,结合大规模预训练模型压缩算法和高性能计算方案上的优势,打磨产品力,最终研发出在垂直领域集推理速度快、回答准确率高、响应速度快、吞吐率强、外挂数据库容量大、数据可交互治理、能私有化部署等多重优势的“高性能智库Agent”产品。大模型时代,训练数据获取和复用成本的降低,效率却显著提升。

  “智库Agent相较于传统产品来说,性能更高、响应更快、保密性好,拥有针对多模态数据(视频图片、文字)的RAG算法且对上传文件的数量没有限制,能够能快速分析上传的文件内容,实现各类数据统一治理加个性化推送。优点足够突出,用户体验感才能好。”路思远介绍道。“但是大模型技术成本高,且最新深度学习NLP算法更是部署难、落地难。我们在NLP的算法、硬件、云端、嵌入式端部署等方面积累关键技术使得产品在软件与硬件方面有突出优势,从而大大降低成本。”高性能智库Agent产品属性能很好地应用于开源情报领域,风语智能通过人工智能与开源情报的结合,在大模型产品落地方面上探索出一条新路径,推动了该领域迈向智能化、自动化时代。

  目前风语智能团队已与5家客户签订项目合作协议、与十余家进入探讨合作,包括江苏头部政府智库、博智安全、南京云创大数据等。其中为某医院建立精神疾病问诊的大模型知识库已得到有效推进,通过提升医院的数据分析能力与水平,实现病案智能生成,辅助医生诊治,达到医院问诊速度与准确性提升的目的。

 

 

团队紧密合作,开创产品新未来

 

  “创业征途,团队为舵,齐心协力,行必致远。”路思远博士作为发起人,联合深度学习数据压缩方向的施禹伯博士组成团队,邀请导师王中风教授和南大信息管理学院裴雷院长等学界与业界大咖担任首席科学家和技术顾问,背靠南京大学ICAIS实验室,在雄厚的技术研发背景和实力下,团队紧密配合,分工明确,借鉴大模型技术迅速研发新产品。

  “接下来,我们希望为客户提供实际应用中所需的软硬结合解决方案,实现产品软硬一体”。谈到规划,路思远表示将持续研发和迭代高性能的硬件设备,为风语智能产品的安全性能提供重要的保障,以确保产品接入网络获取外部信息时用户内部数据不外泄。与此同时,让公司的产品服务在软硬件一体的加持下,壁垒更高、竞争力更强。

  如今,风语智能已研发出了针对情报行业细分需求的软硬件一体化产品,申请了多项知识产权,并与多家公司达成项目合作,荣获多个优秀项目奖项……取得傲人成绩的背后是风语智能团队的创业投入和激情,以及对商业市场的敏锐度和拓展能力。

  南京市创新投资集团大创投资团队表示,“赢在南京”青年大学生创新创业大赛我们关注到了风语智能。风语智能作为开源情报业与人工智能领域的创新公司,作为来自南京大学的年轻创业团队,拥有扎实的技术背景,助力产品落地开源情报领域。作为国有创投机构,我们将持续关注早期科技企业的发展,并围绕资本、管理、资源、人才等给予团队更多投后助力。未来,我们将不断加强与在宁高校科研院所的合作联动,切实落实南京市校地融合发展要求,支持更多如风语智能一样的青年创业企业,大力促进更多高校青年科研成果转化落地。”

  “经过探索,我们已经瞄准赛道,逐步实现产品研发到落地的商业闭环,”路思远介绍说。“选择开源情报行业深挖大语言模型的应用也是几番思索的结果。大国博弈,情报是重要决策的基础,科技实力是最直接的竞争。缺乏高质量、及时准确的情报或许将让企业乃至国家面临极其被动的局面。所以,我们也想在自己擅长的领域,为中华民族伟大复兴贡献一份力量,至少在开源情报这条赛道上,助力国家建立自己的核心竞争力!”路思远在谈及对于深耕开源情报业的愿景时,目光坚定。

 

 

  来源:创投集团

  审核:薛瑶

  发布:尤异