專題副刊

百度推出“文心一言” 擅長文學創作數理推算

百度正式推出大型語言模型“文心一言”,並展示了文心一言在多個使用場景中的綜合能力。

從百度所展示的能力來看,文心一言某種程度上具有對人類意圖的理解能力,但百度CEO李彥宏也多次提及,這類大型語言模型還遠未到發展完善的階段,所以仍有進步空間。

Advertisement

發佈會現場,李彥宏展示了文心一言在5個使用場景的表現,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。

在文學創作場景中,文心一言根據對話問題把知名科幻小說《三體》的核心內容進行了總結,並提出了5個續寫《三體》的建議角度,體現出對話問答、總結分析、內容創作生成的綜合能力。

此外,文心一言也精準回答了《三體》作者、電視劇角色扮演者等事實性問題。

在面對“於和偉和張魯一有哪些共同點”、“於和偉和張魯一誰更高”這類問題時,文心一言也基於推理能力得出了答案。

ADVERTISEMENT

在商業文案創作場景中,文心一言順利完成了為公司起名、創作標語、寫新聞稿的創作任務。

IT之家從百度獲悉,文心一言大型語言模型的訓練封包括兆級網頁資料、數十億的搜尋資料和圖片資料、百億級的語音日均呼叫資料,以及 5500億事實的知識圖譜等。

文心一言具備多模態生成能力,包括畫圖、寫長文、根據文字生成短視頻內容。

據百度介紹,文心一言還具備了一定的思維能力,能學會數學推演及邏輯推理等相對複雜任務。面對“雞兔同籠”這類鍛鍊人類邏輯思維的經典題,文心一言能理解題意,並有正確的解題思路,進而像學生答題一樣,按正確的步驟,一步步算出正確答案。

在此基礎上,文心一言還表現出中文理解及多模態生成能力。在現場展示過程中,文心一言正確解釋了成語“洛陽紙貴”的含義,並能引述“洛陽紙貴”對應的經濟學理論,同時還用“洛陽紙貴”創作了一首藏頭詩。

在多模態生成方面,李彥宏現場展示了文心一言生成文字、圖片、音訊和視訊的能力。值得一提的是,文心一言甚至能生成四川話等方言語音,而文心一言的視訊生成能力則因成本較高,現階段還未對所有用戶開放,未來將會逐步接入。

百度首席技術長王海峰說,文心一言是新一代知識增強大型語言模型,是在ERNIE及PLATO系列模型的基礎上所研發。它的關鍵技術包括監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大型語言模型都會採用的技術,ERNIE和PLATO中也已有應用和積累,在文心一言中又有了進一步強化,而後三項則是百度已有技術優勢的再創新。

在數理邏輯推演環節,百度問了個雞兔同籠的問題,而文心一言先是發現了題目出錯,後來換了個題目,它就能準確作出回答。

Tags
你也可能感兴趣...