揭秘ChatGPT的强大之处：张钹院士的深度解析

发表时间: 2024-04-26 19:15

ChatGPT(聊天GPT)为什么有这么强大的性能？主要依靠两个"大"。

·首先先说第一个"大"，一个大文本，原来的神经网络是一个字一个字往里输的，现在是一大段的文本往里输。到了GPT-4的时候到了多少？128000个汉字同时输进去，就是300多页的文本同时输进去。什么意思？它能看到全文了，大家想想，一个字一个字看，能看到它的意思吗？所以现在可以全文同时输进去给它处理。

·第二个就是巨大的人工神经网络，ChatGPT(聊天GPT)里头用它做生成，做语言生成，用一个巨大的人工神经网络。这个人工神经网络专门给它一个名字叫"转换器"，就是GPT那个"T"。G是什么？生成式，P是预训练，T是转换器，它是靠这三个东西的。

·最后一个自监督学习，这是OpenAI(开放人工智能)的贡献。所以大家不要认为ChatGPT是OpenAI花四年时间做出来的，不是，是全世界的科学家、工程师花了六七十年的时间的研究才出来的ChatGPT(聊天GPT)。前面两个成果主要是大学做的，只有最后一个成果"自监督学习"是OpenAI(开放人工智能)提出来的。

自监督学习有什么好处？有一个好处就是过去要它学习都要做预处理，预先标注，这个工作量太大，是没法大量学习。自监督学习什么意思？就原来的文本不经过任何处理就可以学了。这样经过这三个，依靠大模型。

·第二个是大文本，自监督学习以后所有文本不要经过任何的预处理就可以学了。这里可以看到文本原来是GB(吉字节)量级，现在是TB(太字节)量级的。大家看一下，45个TB(太字节)，现在OpenAI(开放人工智能)差不多学了45个TB(太字节)。GPT-4的时候45个TB相当于多少？相当于1351万本的《牛津词典》。

大文本(GB 文率。

人文清毒津词典》多少(内容)？人文法葬津词典》是26卷100多本，它相当于学了1351万本的《牛津词典》，它的学问超过今天所有在座的人，所有在座的人学的知识，所有的书本加起来还是它的零头。

人就以为什么ChatGPT(聊天GPT这么厉害，就等于说它读了1351万本的《牛津词典》，它的学问比在座的所有人都要高，而且它的读不是死读，而是理解它的内容，读它内部的知识。

揭秘ChatGPT的强大之处：张钹院士的深度解析

热门阅读

推荐阅读