ChatGPT凭一己之力让全球为AI沸腾,引发了科技巨头之间的聊天机器人军备竞赛。
2019年11月,OpenAI开源了GPT-2语言模型的完整版本(有15亿个参数)。GPT-2是作为OpenAI2018年GPT模型的"直接扩展"而创建的,其参数和训练数据集的大小都增加了10倍。
在GPT-2之后,OpenAI又推出了1750亿个参数的GPT-3,只是其源代码从未被公开。OpenAI认为GPT-3可能被滥用,因此不应开源。包括后来的GPT-3.5、GPT-4都没有开源。目前,公开免费版ChatGPT仍然基于GPT-3.5,不过按月订阅“ChatGPTPlus”的用户能够试用由GPT-4提供支持的更新版本的ChatGPT。
尽管ChatGPT没有开源,但趁着这波热度,还是有不少类似的开源项目出现,GitHub已经有人做个了替代ChatGPT的开源项目列表。
lucidrains/PaLM-rlhf-pytorch
这是一个类似于ChatGPT的模型,但使用的是PaLM架构。在PaLM架构之上实现了RLHF(人类反馈强化学习)。
注:只有源代码,没有数据,没有模型权重,没有聊天系统。
togethercomputer/OpenChatKit
OpenChatKit提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。
注:有完整数据,有模型权重,包括TUI和GUI的精致聊天系统。
oobabooga/text-generation-webui
它是一个用于运行GPT-J6B、OPT、GALACTICA、LLaMA和Pygmalion等大型语言模型的gradiowebUI。其目标是成为文本生成领域的AUTO.MATIC.1111/stable-diffusion-webui。
KoboldAI/KoboldAI-Client
这是一个基于浏览器的前端,用于使用多个本地和远程AI模型进行AI辅助写作。它提供一系列标准工具,包括内存、作者笔记、世界信息、保存和加载、可调整的AI设置、格式化选项,以及导入现有AIDungeon冒险的能力。您还可以打开冒险模式并像AIDungeonUnleashed一样玩游戏。
LAION-AI/Open-Assistant
OpenAssistant是一个基于聊天的助手,可以理解任务,可以与第三方系统交互,并为此动态检索信息。
tatsu-lab/stanford_alpaca
这是StanfordAlpaca项目的repo,该项目旨在构建和共享指令遵循的LLaMA模型。
注:半开源、非真正开源、基于封闭模型等...
BlinkDL/ChatRWKV
ChatRWKV类似于ChatGPT,但由RWKV(100%RNN)语言模型提供支持,并且是开源的。
THUDM/ChatGLM-6B
ChatGLM-6B是一个基于通用语言模型(GLM)框架的开放式双语语言模型,拥有62亿个参数。借助量化技术,用户可以在消费级显卡上进行本地部署(INT4量化级别仅需6GBGPU显存)。
bigscience-workshop/xmtf
此存储库概述了用于创建BLOOMZ&mT0和xP3的所有组件,这些组件在通过多任务微调进行跨语言泛化一文中介绍。
注:有数据,有模型权重,通过API可以实现基础的聊天功能。
carperai/trlx
这是一个用于通过人类反馈(RLHF)进行语言模型分布式训练的代码库,用于微调GPT模型以生成聊天文本的工具,支持在线RL训练多达20亿个参数的模型,以及离线RL训练更大的模型。
databrickslabs/dolly
该模型基于pythia-12b进行训练,使用了约15,000条指令/响应微调记录,这些记录是由Databricks员工在InstructGPT论文的能力领域中生成的databricks-dolly-15k。
LianjiaTech/BELLE
本项目的目标是推动中文大型会话模型开源社区的发展。该项目在原有的StanfordAlpaca基础上优化了中文性能。模型微调仅使用通过ChatGPT生成的数据(没有其他数据)。此repo包含175个用于生成数据的中文种子任务、用于生成数据的代码、用于微调模型的0.5M生成数据等等。
ethanyanjiali/minChatGPT
这个示例演示了如何使用RLHF技术对齐语言模型,使其能够生成类似于ChatGPT的聊天文本。
cerebras/Cerebras-GPT
7个开源GPT-3样式模型,参数范围从1.11亿到130亿,使用Chinchilla公式训练。模型权重已在宽松许可下发布(特别是Apache2.0许可)。
TavernAI/TavernAI
一款主题风格是冒险和探险的聊天机器人,默认AI语言模型是Pygmalion,还包括其他语言模型,比如KoboldAI、ChatGPT、GPT-4等。
Cohee1207/SillyTavern
SillyTavern是TavernAI1.2.8的一个分支,目前正在积极开发中,并添加了许多主要功能。现在,它们可以被视为完全独立的程序。Tavern是一个用户界面,它需要与一个AI系统后端配合使用,才能发挥作用。有多种支持的后端可供选择,包括OpenAPIAPI(GPT)、KoboldAI(可以在本地运行或在GoogleColab上运行)等。
ChatGPT这阵风刮得这么猛,GOTC2023怎会错过?
5月27日至28日,GOTC2023将在上海召开,AIGC(AIGeneratedContent,AI生成内容)将成为本次大会的重头戏。尤其是在“AIisEverywhere”分论坛上,诸多AI专家将深入探讨AIGC背后的技术。
GOTC2023报名通道现已开启,诚邀全球各技术领域开源爱好者共襄盛举!