恐怖的GPT-4

格隆匯 03-15 19:12

NB！對不起，實在沒忍住説出這兩個字。

ChatGPT（GPT-3.5）引爆科技圈後，所有人都在討論，AI下一步會往哪個方向發展。

上一次有這種感覺，還是初代iPhone發佈的時候。

我們並沒有等太久。

隔夜，OpenAI正式推出新品GPT-4，再次點燃了大家的想象力。

老闆Sam Altman直接開門見山地介紹：

這是我們迄今為止功能最強大的模型！

有多強？

就像不少人感歎的：如果GPT-3.5尚屬意料之中，GPT-4則讓我自愧不如。

這一波，真是科幻照進現實了。

01 偉大變革的前奏

怎麼證明一個人比另一個人水平高？

現實社會中，主要手段是考試、拿證。

所以，想讓大部分人直觀地感受到，新AI模型比舊的牛逼，同樣是考試。

OpenAI用GPT-4參加了多項美國通用考試，成績很驚豔：

在SAT數學和閲讀考試中，GPT-4比GPT-3.5高150分；

它還能通過律師模擬考試，得分排在應試者前10%，而震撼全球的GPT-3.5只能排在倒數10%……

隨後，在YouTube上進行的Live Demo中，OpenAI展示了GPT-4的真正實力：總結文章、寫代碼、報税、寫詩……GPT-3.5做不到的，GPT-4輕鬆拿下。

而且，還不僅僅是這樣。

根據OpenAI官網描述，相較於GPT3.5，GPT-4最大的進化在於：“多模態”和長內容生成。

其中的關鍵，就是多模態這個詞，顧名思義，就是不同類型數據的融合。

目前GPT-4最大的突破，就是擁有了“讀圖能力”。

用户可以直接用圖片提問，它能夠在讀懂圖片內容的基礎上，給出有邏輯的回答。

有個形象的例子。

下面這個人用筆在本子上畫了個網站的草圖，然後用手機拍下來，發送給GPT-4。

10秒鐘後，它不僅識別出圖片的含義，還生成了要建立這個網站的代碼。

“您好，您的網站建好了。”

這個事件中，最核心的點並不在於編程、計算和分析能力，而是它能準確理解圖片的含義，並給出解答，甚至是圖片解答。

這就比GPT-3.5高出一個世代了。

兩者的表現力根本不是一個級別的。我們可以理解為，在純文字的年代，照相機的出現，對信息交流產生了多大的促進作用。

這就是AI進化史上類似的事件。

甚至，這也只是表象。更讓我震驚加一點恐懼的，是GPT-4具備的的初步邏輯思維能力。

正如OpenAI在今天的博文中所説：

我們創建了GPT-4，這是 OpenAI 努力擴展深度學習的最新里程碑。雖然在許多現實世界場景中的能力不如人類，但在各種專業和學術基準上表現出人類水平。

在OpenAI提供的一個示例中，GPT-4準確地回答了幾個網絡meme為什麼搞笑的問題，雖然解釋得並不好笑。

GPT-4還學會簡單的邏輯推理了。比如你問，圖片裏的繩子剪斷會發生什麼。它答，氣球會飛走。

它甚至可以講出一些質量不咋地、模式化的冷笑話。雖然並不好笑，但至少，它已經開始理解“幽默”這一人類特質。

這兩件小事看起來挺弱智的，卻是AI向人類思維慢慢進化的標誌。

就像古猿人第一次學會直立行走，石器時代的原始人第一次思考人與自然的關係。

微觀角度看，這沒什麼大不了的。但拉長時間線，以後人的眼光看，這也許正是偉大變革的前奏曲。

就像我們研究原始人走路一樣。

當然，GPT-4依然有侷限性。

首先，它的知識範疇也存在時間限制，截止於 2021 年 9 月。

其次，AI畢竟是AI，OpenAI也表示目前GPT-4並不完美，它在很多場景下的能力都不如人類。

據稱，該模型仍然存在“幻覺”或編造事實的問題，並且在事實方面也不一定總是可靠的，“它傾向於堅持認為它是正確的，即使它錯了”。

OpenAI表示，GPT-4正在努力解決其侷限性，例如社會偏見、幻覺和對抗性提示。

但儘管如此，沒人能否認，GPT非常有潛力。

世界上任何事，最難的永遠不是做不到，而是想不到。

只要有個雛形，哪怕很low、很簡陋，距離做好就不會很遠了。

OpenAI做出ChatGPT，最大的意義是是向大家證明，這種應用是存在的，這種技術是可行的。這件事，不是幹不成的。

就好像多年前，大家都在空談概念的時候，只有特斯拉先做出了成品。

02 成功絕非偶然

一個恐怖的事實：GPT-4早在去年8月就訓練完成了。

之所以現在才面市，是OpenAI需要花6個月時間，讓它變得更安全。

這就不得不讓人浮想聯翩。

會不會已經有GPT-5、GPT-6了，它們到底是什麼樣子？是否已經成長為無法掌控的巨獸？

OpenAI的內部技術，到底領先外界多少年？

巨大的壓力給到全世界。

自ChatGPT發佈以來，國內外眾多科技公司對AIGC技術的追捧已達到空前絕後的熱度了。

Chat GPT剛剛發佈，百度便立即官宣了大模型新項目“文心一言”（ERNIE Bot），將在明天和大家見面。

在此後很短的一段時間內，阿里、京東、騰訊、字節跳動、360等多家互聯網及IT企業紛紛表示對AIGC技術發展的關注和跟進，並同步提出了一些相關計劃。

種種跡象表明，從科技巨頭到行業龍頭，中國企業已紛紛進入AIGC賽道競逐。

但是，這塊蛋糕，並不好吃。

GPT-4是人工智能生成內容——AIGC技術最新進展的代表。

所謂AIGC，是繼專業生成內容（PGC）、職業生成內容（OGC）、用户生成內容（UGC）後，互聯網內容生成的第四個階段——神經網絡深度學習。

這的確是人類科技史上翻天覆地的革命。

GPT-3.5和GPT-4，之所以能生成文字、代碼、語音、圖片、視頻，完成語言翻譯、文案撰寫、腳本編程，是因為OpenAI對數據、算力、算法等關鍵要素進行了幾個世代的升級。

先説數據。

僅GPT-3.5的訓練參數，就達到1750億個以上。

想要把如此海量的數據被反覆投餵給AI模型，單次訓練成本就高達460萬美元。

如果不是先有馬斯克、後有微軟的支持，OpenAI是不可能耗費得起的。

再説算力。

2012-2018年，全球AI算力需求增長約為30萬倍，這個數字已經很恐怖了。

但從2018年起，隨着Google Duplex、Open AI Five以及新華社全球第一個“AI合成主播”上崗，人工智能技術開始加速落地。尤其是今年，稱得上是爆發之年。

按照現在的進度，根據預測，AI所需算力每100天將翻一倍。

也就是説，到2030年，AI所需算力是現在的3200萬倍。（2的25次方）

顯然，如果不在軟件服務、硬件支撐、芯片技術等方面協同創新，我們的算力水平不可能實現指數級別的增長。

GPT-4的訓練是在微軟雲上進行的。而在全球雲計算市場，微軟雲排名第二，再加上芯片技術的高速發展，這些都為ChatGPT的橫空出世奠定了堅實的算力基礎。

最後説算法。

相比傳統的AI算法，GPT的優勢在於，通過海量參數，進一步提升模型的精確度。

初代GPT模型的參數是1.17億個；GPT-2事15億個，增加了10倍；GPT-3達到1750億，是GPT-2的 100 倍；而GPT-4的真實參數在1750億-2800億之間，並沒有比GPT-3高出太多，其重點在數據處理優化上。

這種大模型算法的實現，必須有高效率的算法框架來支撐，因為參數量上去之後，需要把模型和數據分散放到多個GPU卡上，卡之間如何通信、調度，如何進行高效的反向傳播，都需要大量高水平技術人才來推進和實施。

GPT之所以獨特，就是在目前世界上最強大的LLM（大語言模型）為基礎的同時，引入了基於人類反饋的強化學習方法，從而提高了對話的質量，而升級到多模態預訓練大模型GPT-4版本後，其對話質量變得更加強大、完美。（具體可閲讀《ChatGPT的兩宗罪》）

同時也能看到，GPT-4之所以比GPT3.5強得有限，可能就是算法的效率達到瓶頸了。

GPT-5，可能沒有我們想象的那麼快到來。

綜上，可以看出，ChatGPT是靠強大算力和高成本，用大規模的數據“喂”出來的AI模型，它的出圈看似是偶然的，但其成功卻絕非偶然。

其他公司想要複製一款ChatGPT，絕非隨便設計個對話模型就完事。

事實上，國內AI領域真正缺乏的是技術積累，包括數據的清洗和標註、模型的結構設計，以及怎麼訓練、推理等，這些技術很多都需要經驗和積累，需要大量的科研人才和普通技術人員一步一個腳印走出來。

這方面，目前大公司更有優勢。

比如百度，之所以能儘快推出“文心一言”，就是因為其十年多來累計投入了超過1000億元的技術研發經費。

而小公司，不僅承擔不起高昂的成本，也沒有前期的技術研發沉澱。跟風入局，雖然在股市裏有一時的風光，利用時間差賺一些塊錢。

但長遠來看，終究會被市場淘汰。

當然，並不是説小公司完全沒有機會，若能真正腳踏實地做好AIGC相關的一個細分板塊，依然有機會跑出來。

願國內科技公司在追趕世界前沿科技的同時，少一些嬌嬈炒作，少一些急功近利，多一些創新實幹，多一些厚積薄發。

03 尾聲

今天有個熱搜挺有意思的。

説是《校花的貼身高手》水了一萬多章，十多年還沒完結，被讀者舉報了。

看得人一臉懵逼，這不是剛上高中時躲被窩裏看的麼。作者魚人二代，當年還挺火的，《極品修真強少》、《很純很曖昧》都是青春期難忘的回憶。

印象中，這部小説早就被翻拍成電視劇，下意識便以為完本了。

其實想想也正常，追了一萬多章的書，校花都成阿姨了，男主還是個雛兒，讀者當然生氣……

還有另一種説法。

平台和簽約作者有協議，只要小説不斷更，每個月就有幾萬元固定收入。所以本該完本的小説，作者又找了個代筆，磨磨唧唧水了近十年。

這波啊，是反向薅資本家羊毛，堪稱吾輩楷模。

平台被薅得受不了了，於是自己找人偷偷舉報。

聯想一下。

當ChatGPT、“文心一言”在國內普及後，如果過氣的老牌作者人手一個，天天水字數，能白嫖多少稿費？

想想就流口水啊。

對已經功成名就的部分網文作者而言，AI的普及，大概率是件好事。

但對其他人，不一定如此了。

根據上文，總的來説，GPT-4 的已經證明了，它有能力在很多領域，呈現出超越人類的表現。

甚至有傳言稱，GPT-4通過了“圖靈測試”，在邏輯能力上與絕大部分人類已經無異。

現在唯一的門檻，就是成本問題了。

一旦算力、算法、數據得到突破性進展，成本降下來了，就真的會對一些產業形成衝擊。

説不定吃着火鍋唱着歌，突然就被 AI 把命給革了。

當然，我還是那個觀點：快點學，快點用。

AI畢竟是工具，是被人奴役的對象。

即使將來淘汰一部分人，也是先淘汰那些不會使用先進工具的人。

我愛這個魔幻的世界。（全文完）

相關股票

聯絡我們

客服專線︰+852 3018 4526

郵箱︰cs@usmarthk.com

地址︰香港上環德輔道中308號26樓2606室

WhatsApp︰+852 5989 2641

市場資訊

恐怖的GPT-4

01

偉大變革的前奏

02

成功絕非偶然

03

尾聲

站點服務

關於

協議聲明