IDEA研究院讲席科学家张家兴:中文世界需要有中国文化内核的AIGC模型财专访

“中文世界需要有中国文化内核的AIGC模型,行业发展还需要有更多的AIGC产品创新出现,传统产品都值得用AIGC做一次升级。”

▍个人介绍

现任IDEA研究院讲席科学家,认知计算与自然语言研究中心负责人;曾任微软亚洲研究院研究员、蚂蚁金服资深算法专家、360数科首席科学家。

▍第一标签

AIGC底层技术研究和实践的领军者

▍组织简介

粤港澳大湾区数字经济研究院(InternationalDigitalEconomyAcademy,简称“IDEA研究院”)成立于2020年,目前已聚集包括院士、世界著名大学教授、世界知名开源系统发明人在内的国际一流技术专家,致力于在AI基础技术与开源系统、人工智能金融科技、区块链技术与机密计算、企业级AI系统、产业智能物联网与智能机器人等领域研发国际顶尖成果,并培育一批国际领先科技企业,带动深圳乃至大湾区万亿级数字经济产业发展。

IDEA研究院认知计算与自然语言研究中心(CognitiveComputingandNaturalLanguage,CCNL)致力于推动预训练大模型为代表的新一代认知与自然语言基础前沿技术的进一步发展,力图解决大模型实际落地过程中的全部技术问题,构建对话机器人、知识抽取、知识体系等自然语言领域的新的技术架构,打造认知人工智能的新技术范式。

AIGC正成为继PGC和UGC之后的全新内容创作模式,底层模型能力突破带来的行业应用潜力初现。在AI绘画这一技术应用分支,受海外StabilityAI公司开源StableDiffusion模型推动,行业准入门槛大幅降低,AI绘画的产业化和商业化进程加速。

由此可见,在AIGC行业发展初期,底层模型的迭代、开源将成为重要的核心推动力。基于此,CCNL于今年11月1日正式开源了自主研发的首个中文StableDiffusion模型“太乙”,旨在更好地助力中国AIGC文化产业数字化转型的创新发展。

IDEA研究院讲席科学家张家兴在接受财联社记者专访时表示,中国并不缺乏产品创新者,当下欠缺的是AIGC底层能力的提供者。“我们团队希望在中国的AIGC产业里,承担OpenAI跟StabilityAI这样的角色,不断迭代底层模型能力,助力上层出现更多的产品创新,服务于更广泛的用户。”

受海外StabilityAI公司开源StableDiffusion模型启发,CCNL于今年11月1日正式开源了自主研发的首个中文StableDiffusion模型“太乙”,将AI绘画底层模型带入中文语境。

之所以选择推出“太乙”,张家兴表示,一方面因为英文模型会产生翻译损耗、难以生成具有中国文化内核的图片。另一方面StableDiffusion模型已经在英文世界中证明了自己的价值,即极大降低了AIGC行业门槛,中文世界同样需要一个“原汁原味”的StableDiffusion模型去推动整个产业发展。

对于AI来说,“投喂”什么样的数据会直接决定学习结果。例如,在英文StableDiffusion模型中输入“宫殿”关键词,由于系统默认为英文思维,故输出的也是西方类型的各式宫殿图片。而在“太乙”中输入“宫殿”,生成的则是具有中国特色的宫殿建筑。输入人像、古诗类描述词也是同样的道理。

张家兴透露,“太乙”的训练数据量超过了1亿对的中文的图文对。“我们已经把整个团队都投入进去了,几十个成员基本都是在围绕着AIGC模型研究实践,也希望做一些更贴近下游应用的AIGC模型。”

实际上,目前StableDiffusion模型技术并不完美。一个最明显的不足点是,当图片为照片风格时,人脸生成和人手的生成质量较差。为此,“太乙”加入了图像编辑功能,用户可以对一张图片的人脸部分进行单独修复,这是原版StableDiffusion模型无法支持的。

在整个AIGC行业,“太乙”作为底层模型,为应用层提供技术支撑。张家兴表示,推出“太乙”只是CCNL在AIGC方向上走出的第一步,后续团队将从三个层面持续发力。

一是不断进行模型迭代,对模型结构进行创新、构建质量越来越高的数据集等,完善最基础最底层的AIGC模型。目前CCNL已经开源了88个预训练模型,整体称为“封神榜”是目前中国最大的预训练模型开源体系。

二是推出针对特定领域的AIGC模型,例如二次元、科幻、游戏等领域。张家兴认为,一个通用的AIGC模型很难在所有领域上都表现出色,而与各垂直行业业内公司合作,有助于一同推出更多精准的模型工具。

三是通过API(ApplicationProgramInterface,应用程序界面)将模型接入更多的业务场景。“太乙”团队目前已经推出了API功能,免费提供给用户,每人每天有1万的调用额度。“这足以支持一个小团队前期去做产品创新,在特定领域面向特定用户的公司,往往有自己独特的经验和产品上的想法。这个时候可以直接调用我们的API构建产品,如果后期试验的比较成功了,我们可以再进一步探讨如何做一些针对产品的定制化的模型。”张家兴表示。

当前阶段,“太乙”已经在推进一些生态合作,对象主要瞄准在数据和场景上有优势的公司,CCNL提供模型技术支持,对方公司则专注于产品运营,双方形成优势互补关系。

张家兴透露,目前团队也在跟一些在图片数据上非常有优势的头部公司商议,推出一些商业版的模型,能够生成更高分辨率更高清晰度更写真的照片。

AIGC被业界广泛视为解放未来生产力的工具,与“降本增效”紧密挂钩。在张家兴看来,AIGC改变的更多是生产方式。“现在AI生成一张图片基本上1秒钟就够了,就算需要人工筛选也只需要几分钟。但过去如果是纯人工生成,可能以天为基数。”在AI的加持下,人在创作过程中更多是提供创意,以及筛选和挑选,颠覆了以往的生产方式。

张家兴表示,中国不缺乏做产品创新的人,但现在缺少AIGC底层能力的提供者。“海外比如OpenAI和StabilityAI两家公司,对整个AIGC产业提供基础设施。国内这方面目前比较欠缺,至今没有这样的一个商业公司出现。”

“这就造成一个问题,每个想做AIGC的公司从模型到产品都要考虑在内,但前期的资源往往有限,可能更多为了保证产品效果,在底层模型研发上投入不了那么多的精力,也不可能投入像OpenAI和StabilityAI那么大的资源,基本上是对模型进行一些微调,然后就上线了,这样其实会存在大量问题。”张家兴表示。

张家兴透露,目前部分推出AIGC产品的公司已经大体实现收支平衡,头部产品已经有很大的用户体量和日调用量。“但其实还需要有更多AIGC的产品和落地场景出现,包括一些传统场景,比如图片搜索和图库,值得全部做一次升级。”

至于眼前的机会,张家兴表示,明年最值得期待的是视频和3D功能突破。“目前两方面还处于初级阶段,类似于两年前的图像生成。而人工视频的制作成本要比图片成本高,但对于AI来说区别不大,如果有AIGC技术在这些方面大幅度应用的话,会产生更大的商业价值。”

THE END
1.太空工厂太空工厂-专注于商业航天供应链电子采购平台,卫星火箭及周边商品,主要集中了航天企业之间相互采购、合作、检测、供需求发布等服务,是商业航天供应链上下游首选的航天电子采购平台。http://test.spacef.com/future_news_show?id=279
2.中国的航天科技和供应链有什么关系?供应链新浪财经转自:CGTNhttp://finance.sina.com.cn/jjxw/2024-11-29/doc-incxtefu8794846.shtml
3.航天科技:公司物联网业务中的车联网业务通过数据中心和后台服务平台航天科技(000901.SZ)11月27日在投资者互动平台表示,公司物联网业务中的车联网业务通过数据中心和后台服务平台,实现服务政府道路车辆监管、服务运输企业经营管理和服务车主驾驶需求等功能。 (记者 蔡鼎) 免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。https://www.163.com/dy/article/JI10AOHS0512B07B.html
4.航天供应链服务平台用户操作手册航天电子采购平台.PDF航天供应链服务平台用户操作手册-航天电子采购平台.PDF 25页内容提供方:fengruiling 大小:3.31 MB 字数:约6.06千字 发布时间:2019-05-02发布于天津 浏览人气:426 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)https://m.book118.com/html/2019/0425/5111031231002031.shtm
5.航空专业服务平台幸福航空有限责任公司于2008年由中国航空工业航空集团发起组建,2018年11月,陕西省、西安市与中国航空工业集团签署协议,西安航空航天投资股份有限公司牵头对幸福于打造安全、高效、便捷的航空货运服务,将高效协同京东物流基础设施网络,最大限度提升一体化供应链物流服务品质,同时加快构建覆盖全国、安全可靠、保障有力的http://www.hangkong919.com/
6.西安航天基地:以金融之力推进高水平对外开放航天基地陕西创智星辰科技发展有限公司,为西安航天高技术产业发展集团有限公司下属子公司,2022年9月成立。作为陕西航天经济技术开发区和河北唐山曹妃甸经开区共建的合作平台,该公司聚焦主责主业,开拓进取主动作为,取得良好运营成效。 供应链平台建设 星辰公司经一年运营,初步建立了石油产品和农产品两个主要领域的大宗商品供应链。 https://news.hsw.cn/system/2024/0411/1735712.shtml
7.产业结构调整指导目录(2019年本)用于航空航天、核工业、医疗等领域高性能钨材料及钨基复合材料, 高性能超细、超粗、复合结构硬质合金材料发与生产,长碳链尼龙、耐高温尼龙等新型聚酰胺开发与生产 11、5万吨/年及以上溴化丁基橡胶、溶聚丁苯属矿开釆、加工、贸易、应用、投资等产业大数据平台技术开发和 建设 10、30万平方米/年及以上超薄复https://www.cnjx.gov.cn/News/show/1241848.html
8.好买基金网公司介绍:发网集团成立于2006年,主要为品牌商、渠道商,提供仓配一体化的物流供应链服务,截至目前,已累计服务2500多家品牌客户,覆盖近3.5亿消费者,仓储网络覆盖全国。作为全渠道供应链服务平台,发网成立十七年来,坚持以IT系统为核心、智能算法为支撑,把互联网技术、移动互联网技术、智能物联网AIoT技术相结合,打造数“http://www.howbuy.com/news/2023-07-06/5827063.html
9.青岛中关村信息谷科技服务有限责任公司精密零部件加工行业中关村装备制造供应链服务平台是一个专注于为企业解决各类生产需求的供应链服务平台,平台涵盖精密机械加工、注塑模具、冲压模具及产品、钣金、铸造及加工、PCB贴片、线束集成等各类供应商,为各行业各类型企业提供全方位的专业化服务。 了解更多 + 平台基础 中关村信息谷的大平台 http://www.qdzgcpt.com/
10.数字供应链平台数字供应链平台建设于2019年。数字供应链平台以推动航天理念、航天品牌、航天资本走出去,引导国际人才、高端技术、 创新思维走进来为宗旨,建设包含生产企业、供货单位、采购单位、外贸服务单位、 中介机构、金融机构、物流企业等多种业态共存的国际合作生态圈, 形成生产与服务相结合、线上与线下相结合、售前与售后相结合https://www.mrovipmall.cn/
11.专家观点图14 面向航天科工集团复杂产品的协同云服务应用 6. 基于知识图谱的供应链优化 基于知识图谱技术为国家某部委建设了“资源布局与产业链分析监测平台”,该平台中覆盖国民经济近20个门类、400多领域、1382个行业小类、15余万家企业和27500余种产品,通过知识图谱技术构建了关系数达到百亿边的全要素、全行业、全地域产业http://www.aii-alliance.org/index/c184/n2097.html
12.62家央企数字化转型路线图发展服务数字化转型,通过“上云用数赋智”大力发展服务型制造。 38 中国物流打造智慧物流、数字供应链 大力发展专业物流、智慧物流、绿色物流、应急物流、共享物流; 推进产业数字化、数字产业化,共建共享物流大数据平台; 发展流通新技术、新业态、新模式,助推产业转型升级。 https://www.ciicmc.com/nciichr/zyzx96/ldy/zcjd64/871552/index.html