检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统检索增强生成(RAG)实践：基于Ll|chatgpt侧边栏+gptsgpt-4turbo联网绘图_算命

Qwen1.5版本年前开源了包括0.5B、1.8B、4B、7B、14B和72B在内的六种大小的基础和聊天模型，同时，也开源了量化模型。不仅提供了Int4和Int8的GPTQ模型，还有AWQ模型，以及GGUF量化模型。为了提升开发者体验，Qwen1.5的代码合并到HuggingFaceTransformers中，开发者现在可以直接使用transformers>=4.37.0而无需trust_remote_code。

与之前的版本相比，Qwen1.5显著提升了聊天模型与人类偏好的一致性，并且改善了它们的多语言能力。所有模型提供了统一的上下文长度支持，支持32K上下文。还有，基础语言模型的质量也有所小幅改进

Qwen1.5全系列统一具备强大的链接外部系统能力（agent/RAG/Tool-use/Code-interpreter）

正因为Qwen1.5作为中文LLM率先合入了Transformers，我们也可以使用LLaMaIndex的原生HuggingFaceLLM来加载模型。

Qwen系列模型相比同规模模型均实现了效果的显著提升。我们评测的数据集包括MMLU、C-Eval、GSM8K、MATH、HumanEval、MBPP、BBH等数据集，考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。Qwen-72B在所有任务上均超越了LLaMA2-70B的性能，同时在10项任务中的7项任务中超越GPT-3.5.

测算了BF16、Int8和Int4模型在生成2048个token时的平均推理速度（tokens/s）和显存使用。结果如下所示：

下面记录7B和14B模型在单GPU使用LoRA（LoRA(emb)指的是embedding和输出层参与训练，而LoRA则不优化这部分参数）和QLoRA时处理不同长度输入的显存占用和训练速度的情况。本次评测运行于单张A100-SXM4-80GGPU，使用CUDA11.8和Pytorch2.0，并使用了flashattention2。我们统一使用batchsize为1，gradientaccumulation为8的训练配置，记录输入长度分别为256、512、1024、2048、4096和8192的显存占用（GB）和训练速度（s/iter）。我们还使用2张A100测了Qwen-7B的全参数微调。受限于显存大小，我们仅测试了256、512和1024token的性能。

具体数值如下所示：

LlamaIndex是一个基于LLM的应用程序的数据框架，受益于上下文增强。这种LLM系统被称为RAG系统，代表“检索增强生成”。LlamaIndex提供了必要的抽象，可以更轻松地摄取、构建和访问私有或特定领域的数据，以便将这些数据安全可靠地注入LLM中，以实现更准确的文本生成。

LlamaIndex有用性的核心是其有助于构建LLM应用程序的功能和工具。在这里，我们详细讨论它们：

LlamaIndex提供数据连接器，可以提取您现有的数据源和格式。无论是API、PDF、文档还是SQL数据库，LlamaIndex都可以与它们无缝集成，为您的LLM准备数据。

使用LLM的主要挑战之一是以易于使用的方式构建数据。LlamaIndex提供了在索引或图表中构建数据的工具。

LlamaIndex不仅仅是摄取和构建数据。它还为您的数据提供高级检索或查询界面。只需输入任何LLM输入提示，LlamaIndex将返回检索到的上下文和知识增强输出。

LlamaIndex允许与您的外部应用程序框架轻松集成。您可以将它与LangChain、Flask、Docker、ChatGPT以及您的项目可能需要的任何其他工具一起使用。

无论您的熟练程度如何，LlamaIndex都能满足您的需求。初学者用户会喜欢高级API，它允许使用LlamaIndex以仅五行代码来摄取和查询他们的数据。另一方面，高级用户可以根据需要利用较低级别的API自定义和扩展任何模块（数据连接器、索引、检索器、查询引擎、重新排名模块）。

文本表示示例,输入一个句子,输入一个固定维度的连续向量:

文本的向量表示通常可以用于文本聚类、文本相似度计算、文本向量召回等下游任务中。

在ModelScope框架上，提供输入文本(默认最长文本长度为128)，即可以通过简单的Pipeline调用来使用GTE文本向量表示模型。ModelScope封装了统一的接口对外提供单句向量表示、双句文本相似度、多候选相似度计算功能

安装依赖库1

!pipinstallllama-indexllama-index-llms-huggingfaceipywidgets!pipinstalltransformers-Uimportloggingimportsyslogging.basicConfig(stream=sys.stdout,level=logging.INFO)logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))fromIPython.displayimportMarkdown,displayimporttorchfromllama_index.llms.huggingfaceimportHuggingFaceLLMfromllama_index.core.promptsimportPromptTemplatefrommodelscopeimportsnapshot_downloadfromllama_index.core.base.embeddings.baseimportBaseEmbedding,EmbeddingfromabcimportABCfromtypingimportAny,List,Optional,Dict,castfromllama_index.coreimport(VectorStoreIndex,ServiceContext,set_global_service_context,SimpleDirectoryReader,)因为Qwen本次支持了Transformers，使用HuggingFaceLLM加载模型，模型为（Qwen1.5-4B-Chat）1

embeddings=ModelScopeEmbeddings4LlamaIndex(model_id=embedding_model)service_context=ServiceContext.from_defaults(embed_model=embeddings,llm=llm)set_global_service_context(service_context)index=VectorStoreIndex.from_documents(documents)

THE END

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统检索增强生成(RAG)实践：基于Ll

chatgpt怎么绘画chatgpt绘画攻略

2024年AI应用之王：从绘画到写作，你不能错过的AI工具大全

探索国内使用openai和azuregpt4的应用场景微软机器人人工智能知名企业自然语言处理

探索国内使用openai和azuregpt4的应用场景微软机器人人工智能知名企业自然语言处理

如何在Linux终端设置和使用ChatGPT

『全网首发』NexusGPT——目前为止看到的最有创意的AutonomousAgAI&chatGPT长臂猿

ShellGPT在终端里使用ChatGPT（用自然语言执行命令）：更新我的系统从大到小列出文件帮我安装Docker...

知名的GPT应用程序的功能腾讯云开发者社区

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统检索增强生成(RAG)实践：基于Ll

吴恩达新课，我毕业了

WhatsGPTAI神器大全

Official?ChatGPTappforWindowswillbeavailablelaterthisyear,butmacOScantrynow

检索增强生成(RAG)实践：基于LlamaIndex和Qwen1.5搭建智能问答系统云社区