记者今日从深言科技获悉,深言科技“语鲸大模型”正式通过《生成式人工智能服务管理暂行办法》备案,将陆续面向社会公众开放服务。

  “更懂中文”的大模型通过备案

  公开资料显示,深言科技由清华大学自然语言处理实验室与北京智源人工智能研究院共同孵化,是国内最早开展大模型研发与探索大模型落地的创业公司之一。据深言科技介绍,“语鲸大模型”具备强大的语义理解与文本生成、代码理解与生成、逻辑推理等能力,提供文本创作、数学计算、代码补全等服务,核心的优势是在中文理解和生成能力上行业领先,做到了更懂中文,更懂中文使用场景。

  由于天然的语言差异和屏障,国外的英文大模型无法用于中文语言信息处理场景。而中文大模型的研发远未成熟,实际性能相较英文大模型仍有不小差距。“中文语言信息智能处理这一极为广阔的市场仍然是一片蓝海。”深言科技有关负责人表示,公司希望以自研的中文超大规模预训练模型为核心构建工业级中文信息处理引擎,并研发最优秀的产品,引领中国的语言信息处理智能化革命。

  今年11 月初,深言科技联合清华大学NLP实验室开源了语鲸-8B模型。据介绍,语鲸-8B模型在数万亿token的高质量中英数据上进行预训练,具有强大的基础能力,在多个公开评测基准上均达到领先效果。目前,公司研发的产品已有数百万用户,且已与国家部委、行业龙头等标杆客户达成商业合作。

  公司同时还透露,尽管融资环境不佳,但公司成立之初就获得了多家一线基金的千万元级投资支持。记者查询天眼查APP获悉,深言科技目前已完成4轮融资,融资阶段处于A+轮,但每轮融资的金额暂未披露。投资机构包括英诺天使基金、奇绩创坛、水木清华校友基金、零一创投、红杉中国种子基金、腾讯投资、好未来战略投资部、中关村发展集团、三七互娱创投基金、春华资本、商汤国香资本等。

  此前已有两批大模型产品通过备案

  今年是中国大模型发展的元年,也是行业监管启动的元年,一系列规范政策陆续出台。

  4月11日,国家互联网信息办公室发布的关于《生成式人工智能服务管理办法(征求意见稿)》提出,利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。

  8月15日,由国家互联网信息办公室等七部门联合发布的《生成式人工智能服务管理暂行办法》(以下简称《办法》)正式实施,这也是我国首个针对生成式人工智能产业的规范性政策。《办法》明确要坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展。随后,两批国内大模型产品相继通过备案。

  8月31日,第一批通过备案的公司集中宣布向广大用户开放,其中包括百度文心一言、商汤大模型“商量SenseChat”、百川智能的百川大模型、智谱华章的“智谱清言”等。除此以外,抖音云雀大模型、智谱AI“GLM”大模型、中科院紫东太初大模型,MiniMax“ABAB”大模型、上海人工智能实验室书生通用大模型、360公司的“360智脑”等大模型也陆续对公众开放。

  11月4日,网易有道“子曰”教育大模型、昆仑万维“天工”大模型、知乎“知海图AI”模型、金山办公“WPS AI”、好未来“MathGPT”大模型、面壁智能“面壁露卡Luca”、出门问问“序列猴子”、月之暗面“moonshot”以及美团等公司的大模型产品通过备案,可以面向全社会开放服务。

  艾瑞咨询在近期发布的《2023年中国AIGC产业全景报告》中预测,未来对AI大模型的监管将宽松鼓励和整顿规范并重。报告认为,《办法》的监管要求相对宽松,反复强调了鼓励发展的态度。具体来看,《办法》主要规范公共服务环节,不包含有关专业机构的研发和应用环节,鼓励企业在自研自用范围加强技术攻关;其次,《办法》不强求生成内容的真实、准确性,放宽了容错率,对前期探索的企业带来一定利好,但同时也提高了用户辨别的时间和成本。同时,《办法》要求提供者对AI生成内容进行显著标识,有望从根本上杜绝AI生成内容难以辨别的问题,但也可能影响用户对内容的价值判断,对企业带来负面影响。最后,国家以立法的形式打造数据和算力协同共享的平台,最大化促进资源利用,有利于为中小型企业减负,降低研发成本。

  业内人士分析,随着大模型持续发展进化,以及监管走向常态化和有序化,更多的国内大模型有望相继通过备案,面向广大社会公众提供服务。