百度推出“文心一言” 擅長文學創作數理推算

百度正式推出大型語言模型“文心一言”，並展示了文心一言在多個使用場景中的綜合能力。 從百度所展示的能力來看，文心一言某種程度上具有對人類意圖的理解能力，但百度CEO李彥宏也多次提及，這類大型語言模型還遠未到發展完善的階段，所以仍有進步空間。 發佈會現場，李彥宏展示了文心一言在5個使用場景的表現，包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。 在文學創作場景中，文心一言根據對話問題把知名科幻小說《三體》的核心內容進行了總結，並提出了5個續寫《三體》的建議角度，體現出對話問答、總結分析、內容創作生成的綜合能力。 此外，文心一言也精準回答了《三體》作者、電視劇角色扮演者等事實性問題。 在面對“於和偉和張魯一有哪些共同點”、“於和偉和張魯一誰更高”這類問題時，文心一言也基於推理能力得出了答案。 在商業文案創作場景中，文心一言順利完成了為公司起名、創作標語、寫新聞稿的創作任務。 IT之家從百度獲悉，文心一言大型語言模型的訓練封包括兆級網頁資料、數十億的搜尋資料和圖片資料、百億級的語音日均呼叫資料，以及 5500億事實的知識圖譜等。 據百度介紹，文心一言還具備了一定的思維能力，能學會數學推演及邏輯推理等相對複雜任務。面對“雞兔同籠”這類鍛鍊人類邏輯思維的經典題，文心一言能理解題意，並有正確的解題思路，進而像學生答題一樣，按正確的步驟，一步步算出正確答案。 在此基礎上，文心一言還表現出中文理解及多模態生成能力。在現場展示過程中，文心一言正確解釋了成語“洛陽紙貴”的含義，並能引述“洛陽紙貴”對應的經濟學理論，同時還用“洛陽紙貴”創作了一首藏頭詩。 在多模態生成方面，李彥宏現場展示了文心一言生成文字、圖片、音訊和視訊的能力。值得一提的是，文心一言甚至能生成四川話等方言語音，而文心一言的視訊生成能力則因成本較高，現階段還未對所有用戶開放，未來將會逐步接入。 百度首席技術長王海峰說，文心一言是新一代知識增強大型語言模型，是在ERNIE及PLATO系列模型的基礎上所研發。它的關鍵技術包括監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大型語言模型都會採用的技術，ERNIE和PLATO中也已有應用和積累，在文心一言中又有了進一步強化，而後三項則是百度已有技術優勢的再創新。

您好！請登入您的帳號