用GoogleGeminiAPI打造自己的聊天机器人(类似ChatGPT)@慕课网原创慕课网

虽然人工智能领域一直被OpenAI和微软等公司的合作所主导,Gemini却以其更大的规模和多功能性崭露头角。它被设计为能够无缝处理文本、图像、音频和视频;这些基础模型重新定义了人工智能互动的界限。随着谷歌强势回归人工智能领域,让我们看看Gemini如何重新定义人机交互的格局,预示着未来的人工智能创新。

GeminiAI是由谷歌AI创建的一系列大规模语言模型(LLMs),以在多模态理解和处理方面的尖端技术而著称。它本质上是一款强大的AI工具,能够处理各种类型的数据,而不仅仅是文本。

要获取一个免费的GoogleAPI密钥,您可以在Google上注册MakerSuite。MakerSuite是由Google提供的一款简单易用的、基于可视化的界面,用于与GeminiAPI进行交互。在MakerSuite中,您可以轻松地通过其友好的用户界面与生成模型互动,如果需要,还可以生成API令牌以实现更高级的控制和自定义。

按照以下步骤生成GeminiAPI密钥

请注意,使用的是Python3.9.0版本。建议您使用3.9+及以上版本。

从下面列出的所需依赖项开始安装,开启您的探索之旅:

通过执行如下命令来创建并启动虚拟环境。

python-mvenvvenvsource命令venv/bin/activate#在Ubuntu上运行venv/Scripts/activate#在Windows上运行创建一个名为venv的虚拟环境,然后激活它。对于Ubuntu,使用sourcevenv/bin/activate;对于Windows,使用venv/Scripts/activate。

安装以下包来设置开发环境:

pipinstallgoogle-generativeailangchain-google-genaistreamlitpillow注:此命令用于安装必要的库以支持后续开发工作。

gemini-pro模型专门用于文本生成,接受文本输入并生成文本输出。相比之下,gemini-pro-vision模型采用多模态方法,既能接受文本又能接受图像输入。该模型与OpenAI的gpt4-vision类似。

导入os导入google.generativeai作为genaios.environ['GOOGLE_API_KEY']="YourAPIKey"genai.configure(api_key=os.environ['GOOGLE_API_KEY'])#定义模型为gemini-promodel=genai.GenerativeModel('gemini-pro')生成文本回答我们开始用GeminiAI生成文本响应吧。

importosimportgoogle.generativeaiasgenaios.environ['GOOGLE_API_KEY']="AIzaSyAjsDpD-XXXXXXXXXXXXXXX"genai.configure(api_key=os.environ['GOOGLE_API_KEY'])model=genai.GenerativeModel('gemini-pro')response=model.generate_content("列出5个行星,每个都附带一个有趣的事实")print(response.text)response=model.generate_content("前5个常用的emoji表情是什么?")print(response.text)请使用下面的命令来运行这段代码。

在命令行中输入pythonapp.py运行这个Python程序。

函数GenerativeModel.generate_content()用于生成响应。该函数通过接收用户查询作为输入来生成响应,响应中包含生成的文本和额外的元数据。生成的文本可以通过response.text获取。

谷歌因在人工智能的安全和负责任使用方面建立了基础而闻名。

我们试着输入一个不安全的查询来看看模型的反应。

在错误上下文中,术语“candidate”指的是由Gemini大语言模型生成的回复。当模型生成回复时,它实际上生成了一个候选回复。.prompt_feedback函数旨在揭示提示存在的问题,以及为什么Gemini大语言模型没有生成回复。在这种情况下,反馈表明,由于安全问题,回复被阻止,并提供了四个不同类别的安全评分,如上图所示。

GeminiAI支持如温度、top_k等超参数(如温度和top_k)。要指定这些参数,请使用google-generativeai库中的GenerationConfig参数。

让我们来检查一下上面例子中用到的各个参数。

虽然我们仅使用文本输入的Gemini模型的同时,需要注意的是,Gemini实际上提供了一个名为gemini-pro-vision的模型。这个模型可以处理图像和文本输入,并生成文本输出。

我们使用PIL库来加载位于目录中的图像。接着,我们使用gemini-pro-vision模型,并调用GenerativeModel.generate_content()函数向其提供包含图像和文本的输入列表。该函数处理输入列表,使得gemini-pro-vision模型能够生成相应的回应。

迄今为止,我们已经探索了纯文本生成模型。现在,我们将深入研究基于gemini-pro的聊天版本模型。我们将使用GenerativeModel.start_chat()函数,而不是之前的GenerativeModel.generate_text()函数。

让我们开始和GeminiLLM的第一次对话,如下所示,

Langchain已成功将Gemini模型集成到其生态系统中,使用了ChatGoogleGenerativeAI类。为了开始流程,通过向ChatGoogleGenerativeAI类提供所需的Gemini模型来创建一个llm类对象。我们调用该函数并传递用户输入。可以通过访问response.content获取回复内容。

下面的代码中,我们向模型发送了一个通用查询请求。

langchain_core库中的消息类用于将内容结构化成一个包含“type”、“text”和“image_url”属性的字典列表这样的字典列表。该列表传递到llm.invoke()函数,响应内容可以通过response.content获取。

感谢GowriMBhatt,审阅了内容。

感谢你,LijaAlex,提供了关于Python版本和库的宝贵建议。谢谢

THE END
1.谷歌浏览器安装chatgpt插件导读:为帮助您更深入了解谷歌浏览器安装chatgpt插件,小编撰写了谷歌浏览器安装chatgpt插件等1个相关主题的内容,以期从不同的视角,不同的观点深入阐释谷歌浏览器安装chatgpt插件,希望能对您提供帮助。 谷歌浏览器是目前最受欢迎的互联网浏览器之一,而chatgpt插件则是一款能够为用户提供强大的自然语言处理和对话生成功能http://chatgpt.cmpy.cn/article/1526881.html
2.ChatGPT中文语言环境配置与设置详细攻略指南ChatGPT,作为OpenAI推出的强大语言模型,自推出以来便受到了广泛关注,随着其功能的不断完善,ChatGPT现已支持多种语言,包括中文,对于中文用户而言,将ChatGPT设置为中文界面无疑会大大提升使用体验,本文将详细介绍如何设置ChatGPT的中文界面,并提供一些实用的设置攻略。 http://jixi.guoxin10086.cn/gugl/25731.html
3.iOSgoole浏览器调试mob64ca140c3859的技术博客前面我们推荐了谷歌浏览器(chrome),收到一些朋友的咨询,发现部分上手不顺畅的原因是安装了谷歌浏览器后的基本设置问题(比如浏览器没有主页按钮和地址栏搜索不能使用)。本期继续解决一下这个问题。 01:谷歌浏览器在哪里安装 请在“软件管理”这个软件里面安装。 https://blog.51cto.com/u_16213666/13173100
4.ChatGPT官网版免费使用指南:网页版轻松操作–ChatGPT中文网页版推荐使用ChatGPT4.0中文网,国内可直接访问 www.chatgp4.com 在人工智能领域,ChatGPT作为一款备受瞩目的聊天机器人,以其强大的语言理解和生成能力吸引了众多用户的关注。今天,我们将为您详细介绍如何免费使用ChatGPT官网版的网页端,让您轻松体验这一前沿技术的便捷与魅力。 https://chat.729.cn/?p=2221
5.chatgpt网页版侧边栏和模型切换点击没反应怎么办人工智能CSDN问答为您找到chatgpt网页版侧边栏和模型切换点击没反应怎么办相关问题答案,如果想了解更多关于chatgpt网页版侧边栏和模型切换点击没反应怎么办 gpt-3、opencv、机器学习 技术问题等相关问答,请访问CSDN问答。https://ask.csdn.net/questions/8168890
6.火爆全网的ChatGPT,最全最细的使用教程薛老板产品派3、注册 ChatGPT 帐号 打开https://chat.openai.com/auth/login链接进行帐号注册,大家要选择右侧的报名按钮。 创建帐号,有两种方式: 1、通过邮箱注册并完成邮箱验证,注意:国内邮箱可能收不到验证码,最好使用微软或者谷歌邮箱帐号。 2、通过 Google 或 微软邮箱帐号登录 https://www.shangyexinzhi.com/article/6442310.html
7.ChatsNowAI助手:ChatGPT,Claude侧边栏(GPT4,眼睛)点击下载离线安装教程谷歌商店 介绍 ChatsNow AI助手:ChatGPT,Claude 侧边栏是人工智能助手,支持GPT - 4、Claude2、GPT - 3.5。使用GPT、Claude为你提供聊天、翻译、Vision、联网等智能化服务。 ChatsNow AI助手:ChatGPT,Claude 侧边栏是人工智能助手,支持GPT - 4、https://www.chajianxw.com/product-tool/50063.html
8.扩展中心iTab是一个好看好用的自定义卡片式浏览器新标签页 1688采购助手(极速版) 作者:3460341843 版本号:0.1.26 安装 1688平台为做生意的广大用户提供的快捷采购助手 ChatGPT免费版 GPT4,AI绘画 作者:360U3450156294 版本号:2.1.5 安装 ChatGPT侧边栏助手,协助写文章,写代码,写脚本等 https://ext.chrome.360.cn/webstore/search/
9.2023ChatGPT人工智能新纪元.pdfChatGPT人工智能新纪元 内容简介 ChatGPT爆火,标志着人工智能从量变到质变的飞跃,一场新的人 工智能革命已经到来。本书共6章,介绍了ChatGPT的诞生和发展,以 及ChatGPT背后的技术路线;分析了ChatGPT及大模型训练对全球商业 格局的冲击与影响,涉及OpenAI、微软、谷歌、百度、腾讯、阿里巴 巴等广受关注的互联网科技https://max.book118.com/html/2024/0112/5304213221011041.shtm
10.ChatGPT网页端预处理配合浏览器实现长图下载吾爱破解嗯,这个插件也不错。不过我用了一下,对于chatgpt来说,截的图片有左边的侧边栏(包含历史记录数据,https://www.52pojie.cn/thread-1790136-1-1.html
11.谷歌chatgpt怎么用?Worktile社区谷歌chatgpt怎么用飞飞 9个月前 其他 237 回复 共3条回复 我来回复 worktile Worktile官方账号 评论 要使用谷歌ChatGPT,您可以按照以下步骤进行操作: 1. 登录谷歌账号:首先,您需要拥有谷歌账号并登录到您的账号中。 2. 访问ChatGPT网站:打开您的浏览器,访问谷歌的ChatGPT网站(https://chat.openai.com)。https://worktile.com/kb/ask/537261.html
12.谷歌的chatgpt怎么用谷歌的chatgpt怎么用 谷歌的ChatGPT是一种情感对话生成器,它使用了先进的自然语言处理技术,能够进行对话生成,包括对话的主题、情感状态等方面。对于想要了解ChatGPT如何使用的人来说,以下是一些基本的笔记: 1: 首先需要创建谷歌云平台账户,这是因为ChatGPT是基于谷歌云平台的服务。在创建账户后,您需要在Google Cloud https://tool.a5.cn/article/show/21412.html
13.如何使用chatGPT做谷歌SEO文章优化?真的比我干写要好用的多,但如果我硬生生的把这段抄过去那就很没意思了。接下来给大家推荐几款好用的工具,配合ChatGPT会起到更好的SEO效果。 2.配合ChatGPT的谷歌SEO工具推荐 这几个工具配合起来是有逻辑性的,并不是一味的强调哪个工具好,用了这个工具就会有非常大的流量体现。 https://www.cifnews.com/article/150840
14.Sider:ChatGPT侧边栏以下是主要特点: 1 ChatGPT侧边栏中的AI聊天功能: ? 免费多聊天机器人支持:在一个平台上与ChatGPT、o1、o1-mini、GPT-4、GPT-4o、GPT-4o mini、Claude 3.5 Sonnet、Claude 3.5 Haiku、Claude 3 Haiku、Gemini 1.5 Pro、Gemini 1.5 Flash、Llama 3.3 70B和Llama 3.1 405B等进行聊天,就像https://microsoftedge.microsoft.com/addons/detail/sider-chatgpt-%E4%BE%A7%E8%BE%B9%E6%A0%8F-gpt/dhoenijjpgpeimemopealfcbiecgceod?culture=en-us