AI 翻譯的 30 部女頻總裁文長什么樣

    人工智能
    2019
    12/31
    00:09
    雷鋒網
    分享
    評論

    來源:雷鋒網  作者:李勤

    萬萬沒想到,雷鋒網編輯花一塊錢試用一個經由 xx 部批準的合法 " 國際瀏覽器 " 的目的竟然是看海外版霸道總裁文。

    說起來真的有點 " 羞恥 ",畢竟我已經不是愛幻想的 18 歲少女,而是飽經生活折騰的社畜。

    事情是這樣的,前幾天,閱文集團與國內人工智能公司彩云科技合作的 30 部 AI 翻譯網文作品上線了閱文旗下海外門戶起點國際(Webnovel)。

    AI 也來插手網文翻譯,看來,繼 AI PK 速記員,AI 換臉 " 威脅 " 演員之后,在我們的精神文化生活中,AI 又觸達了一個領域。

    這 30 部依靠 AI 走向國際化的網文就是我前面提到的霸道總裁文,還是女頻向的。

    emmm,放眼望去,《豪門謀妻》《豪門千金重生之賺大錢》《喬先生撩妻上癮》。。。部部散發著無法抵擋的總裁魅力。

    試水 

    雖然霸總網文看上去不是什么陽春白雪,但它的譯文卻是 " 精品 "。

    如果翻譯質量以滿分 100 分為計,AI 翻譯的這些作品可以達到 80~ 85 分,相當于專業翻譯的級別。

    彩云科技的運營負責人張可馨稱,合作推出的這 30 本 AI 翻譯的網文屬于現代言情品類,是現在比較受歡迎以及好翻譯的品種,非常適合拿來作為 AI 翻譯網文出海的第一步測試。

    在這次合作中,閱文提供語料、修改詞表、用戶的反饋,彩云進行語料訓練,詞表提取和模型部署,安排得妥妥當當。

    起點國際與 " 彩云小譯 " 合作的 AI 翻譯模型針對普通難度的文本, 翻譯速度能夠達到人工的千倍,同時,在翻譯質量把控上,閱文集團的編輯和智能技術團隊聯合彩云小譯的算法工程師對 AI 模型進行集中性的 " 專項訓練 ",既往優秀的譯本、經典網文原作、標準核心詞庫都是 AI 學習的語料。

    此外,網傳 " 雙方在訓練 AI 模型時還加入了‘翻譯風格’的選項,方便精準進行男頻、女頻,甚至不同品類作品風格的呈現。面對不同的風格要求,AI 能夠將同一句話用多種不同的譯法進行差異化呈現。

    這是個讓人眼前一亮的功能,雷鋒網 ( 公眾號:雷鋒網 ) 了解到,目前這個功能尚未正式上線,是一個 " 正在調教中的模塊 "。

    技術難點 

    剩下的 " 分 " 缺在哪里?

    正如人類譯者的翻譯能力受自身知識面的限制一樣,AI 模型能達到的能力范圍也受到語料范圍的限制。語料中少見但比較淺白的表述,AI 可以根據自己學到的語料 " 猜 " 出正確的翻譯,但遇到比較迂回的表述,如一個語料中從未出現過的成語,AI 猜錯的可能性就會變大。

    彩云科技算法工程師毛詩倩提到,例如:" 燃燈如豆 ", 指的是燈的火焰很小,而不是火焰像豆子。如果語料中沒有出現過這個詞語,那么 AI 就只能翻譯出字面意思。

    公開資料稱,閱文團隊基于自然語言理解技術進行網文內容深入挖掘,通過對大量網文內容和優質社區內容的清洗、訓練和標注,使得機器更好地理解網文內容,建立閱文自己的內容大腦。

    基于閱文內容大腦,閱文智能可以提取網文的一些專有名詞,同時可以自動識別角色(人名)、場景(地名)、升級體系等結構化信息,構建整體網文的知識圖譜。基于這些信息的補充,目前 AI 翻譯能夠較好地翻譯網文特殊領域中的詞、句、段落,包括作品中的人名、地名以及類似 " 金丹 " 這種網文作品特色核心元素詞等專有名詞,并識別出各種代詞指代的對象,盡可能避免傳統機翻中的 " 一詞多譯 "、" 張冠李戴 " 等現象。

    看來,閱文在試圖給合作伙伴的 AI 模型 " 喂 " 更足的語料。

    在構建這個 AI 模型的過程中,毛詩倩遇到了三個難點:

    第一,正確補全句子結構。

    文學作品中有些句子結構復雜或缺省成分,AI 需要自己找到正確出主賓的關系。

    " 還是早點回家吧 "

    AI 看到這句話,可能會有點懵逼,必須使勁找尋主語是 I 還是 You。

    第二,人名指代統一。

    一個人物可能會有多種稱呼。比如一個角色可能大名叫 " 七月,同時還有 " 小七 "、" 月月 " 等好幾個昵稱,AI 需要知道這些稱謂都是指向同一個人,否則翻譯出三個在英文中看起來沒什么關聯的名字,AI 沒有懵逼,但讀者會瞬間懵逼。

    (講真,像我們這種神經大條的讀者,可能肉身看文遇到這種情況也會 " 臉盲 "。)

    AI 還要知道角色的性別,以便正確使用人稱代詞。

    舉個 " 霸總文 " 的例子:

    冷半夏整個人依靠在顧瑾白的懷里,蒼白的臉上帶著放大的笑意,看向冷可欣,口型比劃:你完了!

    Leng Banxia leaned against Gu Jinbai's embrace. Her pale face carried a magnified smile as shelooked at Leng Kexin. She mouthed, "you're done for!"

    上面加粗的部分就是在 AI 知道冷半夏是女性的基礎上才能正確翻譯的結果。

    第三,文風統一。

    上一句是言情小說文風,下一句變成科幻小說文風,讀者就會分分鐘出戲。AI 需要保證一部作品翻譯風格統一,并且符合這個作品本身的品類。

    AI 翻譯還有進步的空間。

    毛詩倩稱,在 transformer 模型的基礎上,目前可以引入對抗訓練、模型蒸餾等改進技術,以及利用非對齊語料預訓練改進翻譯質量的工作,如 BERT、MASS 等,但目前的所有翻譯模型本質上都是基于大數據的擬合,機器還沒辦法像人類一樣真正理解文本。

    AI 的強大助力 

    盡管 AI 翻譯暫時無法像人類一樣 " 機智 ",但對于網文出海這個領域而言,已經產生了非常大的推動力。

    艾瑞咨詢發布的《2019 年中國網絡文學出海研究報告》稱,海外網文讀者對網文翻譯質量比較滿意,但更新速度還需提升。

    在這個背景下,能達到 85 分的 AI 翻譯不得不說是一個滿足需求的好辦法。

    看到這種需求后,國內內容平臺閱文、掌閱都加緊對網文出海的布局。在閱文和彩云科技共同推出 AI 翻譯的 30 部試水網文作品之前,成立于 2017 年 11 月的公司推文科技在 9 個月的數據積累后,于 2018 年 7 月推出了網絡文學人工智能翻譯系統。

    推文科技今年 3 月已完成由 Wifi 萬能鑰匙、連尚文學、聯想之星參與的 1000 萬 Pre-A 輪融資,同樣依靠具備內容資源的平臺朝網文出海進軍。

    按照推文科技接受小飯桌的采訪中所言,1000 字的翻譯,人工需要 1 小時,AI 單芯片只需要 1 秒。成本也降低到原來的 1%, 100 萬字的專業譯者翻譯需要 20 萬元,AI 只需要不到 1000 元。

    毛詩倩對雷鋒網肯定了這種說法,他稱:" 只要錢足夠多,買更多的顯卡部署翻譯模型,速度可以無限大,即使是一張顯卡,它翻譯速度也是人類的千倍。"

    雷鋒網發現,在 AI 翻譯網文出海上,推文科技和彩云科技目前只進行中譯英,但這只是語料多少的問題,張可馨說,要做到 85 分的準確率,需要大量語料,很多小語種的語料比較難收集。

    在語料充足(幾千萬句)的情況下,基本上幾個月之內就可以訓練出一個 AI 翻譯的特定語種類型。

    不過,有意思的是,這位對 AI 翻譯網文模型無比熟練的毛詩倩是一個海歸男性算法工程師,他并沒有月讀 300 本網文。

    海外卻有無數人在等待他的 AI 小伙伴翻譯網文。

    THE END
    廣告、內容合作請點擊這里 尋求合作
    ai
    免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

    相關熱點

    據外媒Venture Beat報道,Facebook人工智能研究院(Facebook AI Research,FAIR)稱,他們推出了一個與紙牌游戲Hanabi相關的最新AI項目。
    業界
    12月1日消息 當地時間11月28日,印尼總統佐科·維多多下令政府機構在2020年取消兩個公務員層級,用人工智能取代,以減少阻礙投資的繁瑣程序。
    業界
    在北京舉行的2019戴爾科技峰會展示了多項科技成果,包括其部署5G、AI時代的產品及解決方案。
    業界
    一年一度的世界互聯網大會進入第二天,少了些大佬,多了些論道。
    業界
    總部位于德國的電子零售巨頭Zalando由商學院畢業生羅伯特·根茨(Robert Gentz)和大衛·施耐德(David Schneider)于2008年共同創立,它既是一家零售商,也是一家科技公司。
    業界

    相關推薦

    1
    3
    主站蜘蛛池模板: aⅴ一区二区三区无卡无码| 日韩制服国产精品一区| 亚洲AV无码一区二区三区性色| 性色AV一区二区三区| 精品日韩在线视频一区二区三区| 国产天堂在线一区二区三区| 国产aⅴ精品一区二区三区久久| 精品国产一区二区三区久 | 色妞AV永久一区二区国产AV| 波多野结衣电影区一区二区三区| 日本v片免费一区二区三区| 国产在线视频一区| 亚洲欧美日韩中文字幕在线一区| 免费精品一区二区三区在线观看| 国产成人一区二区三区免费视频| 婷婷国产成人精品一区二| 精品性影院一区二区三区内射| 国产精品久久久久久一区二区三区| 免费人妻精品一区二区三区| 国产成人无码一区二区在线播放 | 国产精品视频一区二区三区| 精品一区二区三区免费视频| 国产精品香蕉在线一区| 中文字幕在线观看一区二区| 国产精品无码一区二区三区毛片 | 亚洲一区二区三区国产精华液| 亚洲一区二区精品视频| 国产成人免费一区二区三区| 久久久久人妻精品一区二区三区 | 成人精品一区二区三区电影| 免费无码一区二区三区蜜桃| 亚洲一区日韩高清中文字幕亚洲| 久久毛片一区二区| 日产亚洲一区二区三区| 日韩精品一区二区三区大桥未久 | 一区二区三区视频免费观看| 天堂一区二区三区精品| 国产人妖在线观看一区二区| 日韩av片无码一区二区不卡电影| 久久精品视频一区二区三区| 国精产品一区一区三区免费视频|