現在的 AI 不止會寫新聞,還會寫書了。 學術出版商 Springer Nature 出版了第一本由機器學習生成的書籍——《鋰離子電池:機器生成的當前研究摘要》,它概述了鋰離子電池領域的最新研究成果。 + a) c: g' \& e' @8 V
![]()
% ?% m+ ~4 f5 e7 {4 m9 d, C l3 u
AI 是如何寫出一本書的? 這里面用到的技術,是一種由 Springer Nature 和法拉克福歌德大學共同開發的一種先進算法:Beta Writer。 % p Q1 \* F+ s& j3 t- Q
它使用的是基于相似性的聚類分析,將海量的源文檔排列成連貫的章節,然后創建文章的簡潔摘要,同時,將文章內部加入超鏈接,這樣利于讀者進一步閱讀原始的文章。 而 AI 這種創新化的結構化摘錄成書,有利于研究人員更高效地管理海量信息,以及人們從海量內容里快速選擇、使用和處理相關領域的文檔。
$ `6 \& d, e3 ?. ?+ i
![]()
% T8 v6 h6 g: L& s. ^7 D7 p' B
所以確切來說,它其實是該學科里面大量研究文章的摘要合集。 但摘要并不是你想的那么簡單,這本書里面包含了 2016 年到 2018 年發表過的 150 多篇權威研究論文。僅在過去 3 年,關于鋰電子電池的研究論文就發表了超出 53000 篇,這對試圖學習這一領域的科學家是一個巨大的挑戰,但 AI 的自動掃描和總結輸出,能讓科學家們把更多時間用在重要的研究上。
( w/ B/ y2 M6 j2 @
![]()
▲ 圖片來自:The Verge,攝影:Adam Berry/Getty Images % ?; c, c3 |+ R/ n( P# ]- n
雖然它可能和我們想象中的「文采飛揚」、「馳騁墨場」相差千里,但目前它也為研究人員或專業人士展現了一種獲取信息的未來方式。 幾十年來,機器一直在學習人類語言的微妙之處,雖然深度學習算法不斷在更新技術,但就算世界上最能寫的 AI 也無法表達出人的獨特思想。
$ }3 v* S# ^1 h5 O9 s6 s
不過前幾個月 OpenAI 發布一個名為 GPT-2 的新算法,給它一個標題就能進行語言建模完成接下來的情節,最特別的地方就是能夠更靈活地變動內容,甚至寫出一篇粉絲小說。 . E* _ s, M1 I$ F: U- t
![]()
* M, w5 q P0 V; U# J
▲ 圖片來自:openai H+ p, J! X6 r# k4 b* V
$ n9 e9 r7 K: Q可以預見,未來的學術出版以及各類書籍,將不再只是人為創造,而是有更多形式出現,包括了混合人機文本生成的書籍或完全由機器學習生成的文本。 而對于這本書的情況,Springer Nature 的董事總經理 Niels Peter Thomas 說道: % F. ^/ {' J5 u8 E6 K; F' Z/ u
圍繞自然語言處理和人工智能的新技術,為我們提供了在算法幫助下探索內容生成的新機會。作為全球出版商,我們也有責任考慮機器生成內容的影響、機遇、挑戰和風險,并為未來的這類新內容提供基礎的框架。
/ o d! H& M- x' p
![]()
( z6 j7 C2 I5 l, I
▲ 圖片來自:medium
1 T: c3 _! j% D% N+ N0 v% O目前 Springer Nature 計劃通過開發其他領域的內容來擴展這次的試點項目。而《鋰離子電池研究原型》也將成為進一步改進此類技術的基礎。 如果你想讀一下的話,SpringerLink 數據庫里現在也免費為讀者提供了電子書版本。
4 y w0 y) i# W5 ?6 |3 e
但或許我們更期待看到的是,AI 直接創造出的不僅是文字方面的協助,而是基于文字本身的更有價值的內容。 畢竟每個人的思維都有限,而算法擁有無限可能。
, Q2 ~+ p, |& d+ z/ c. ^. F |