除了大家都想体验一下这款智能的ChatGPTAI,也有很多互联网公司开始搭建自己的ChatGPT,但真的挺担心最后整出来的不是ChatGPT而是ChatPPT。为此我也想研究下ChatGPT是怎么做出来的,都说是模型和数据训练,那我能训练吗?这东西离我想做个demo出来有多远?
这还说啥,这有pom配置,还有代码案例。引入一下就能跑,上车吧!
好家伙,跑起代码才知道。这货上来就下了1个多G的pb模型数据,之后有报错MacM1兼容性问题。折腾一大堆,最后又报错;YourCPUsupportsinstructionsthatthisTensorFlowbinarywasnotcompiledtouse:SSE4.2AVXAVX2FMA——要是你咋整,你再坚持坚持,还是放弃!
本来以为ChatGPT嘛、Python嘛、跑个数据模型吗!这能几道墙阻挡我的去路,不就是换个工具写代码吗?但当我逐步进入后发现,这距离好像比想象的大的多!
一口不能呲个胖子,为了更好的为以后能训练出一个自己可以玩的小体量的ChatGPT模型,总得要从头开始。
这里小傅哥的目标是带着搭建先在本地搭建起一个TensorFlow的基础环境,来跑个Python的简单算法模型。为此我们需要进行一下环境配置。小傅哥2台机器已验证没问题,分别是MacIntel/M1,机器配置4核16G。
但这里有个问题,没有说明MacM1怎么安装。如果按照这个代码在M1的机器是安装不上的。所以在小傅哥的一顿折腾后找到了对应的按照指令。步骤如下;
可能很多伙伴不知道什么是算法模型,简单描述比如;为啥给你推荐你喜欢看的美女,为啥给你发送一个键盘购物券、为啥看你小子有钱就总给你推荐豪车。这都是根据你身上的标签进行模型训练的结果,在众多的人群中找到目标用户。另外像我在腾讯做量化算法的小伙伴说,决策树就是一种简单的算法模型。
测试结果
fuzhengwei@MacBook-ProTensorFlow-Tutorial%/usr/local/bin/python3/Users/fuzhengwei/1024/github/TensorFlow-Tutorial/codes/linear_regression.pyEpoch1/5001/1[==============================]-0s3ms/step-loss:0.0150Epoch500/5001/1[==============================]-0s2ms/step-loss:0.01501/1[==============================]-0s76ms/step[[-0.19686729]]1/1[==============================]-0s29ms/step[[-1.0953956]]1/1[==============================]-0s29ms/step[[-1.9939239]]1/1[==============================]-0s31ms/step[[-2.8924522]]1/1[==============================]-0s30ms/step[[-3.7909803]]1/1[==============================]-0s30ms/step[[-8.283622]]