資深媒體人、FT中文網(wǎng)總編輯王豐撰文指出,
巴黎恐怖襲擊后短短一周多的時(shí)間,已有至少四位中國(guó)公民在世界各地被極端伊斯蘭恐怖分子殺害。中國(guó)人再次深切感受到了在一個(gè)全球化的時(shí)代,恐怖主義無遠(yuǎn)弗屆的禍害。
在對(duì)幾次恐怖事件的報(bào)道中,我注意到,中文新媒體平臺(tái)和自媒體都異常活躍迅捷。突發(fā)快訊的翻譯、實(shí)時(shí)進(jìn)展的跟進(jìn),甚至獨(dú)家現(xiàn)場(chǎng)報(bào)道,都可圈可點(diǎn)。但是,相關(guān)媒體在報(bào)道準(zhǔn)確性方面也出現(xiàn)了一些不大不小問題。
巴黎恐怖襲擊尚在進(jìn)行中時(shí),國(guó)內(nèi)各門戶網(wǎng)站、自媒體公號(hào)對(duì)襲擊細(xì)節(jié)和傷亡人數(shù)的及時(shí)更新都動(dòng)人心魄,吸引了很多讀者。但其中不乏誤譯誤報(bào),在短時(shí)間內(nèi)有誤導(dǎo)讀者的可能。印象較深的是,“遇難人數(shù)上升到197”一度被多家新媒體、自媒體引用,事后證明與實(shí)際情況差別很大。甚至有門戶網(wǎng)站專門指出,“197”是法國(guó)警方提供給目擊者的緊急熱線號(hào)碼,不是死亡人數(shù)。
另外一個(gè)比較離譜的錯(cuò)誤是,官方通訊社中新社的網(wǎng)站在11月19日上午發(fā)布了這樣一篇報(bào)道:“美波士頓發(fā)槍擊案 嫌犯引爆爆炸物自殺身亡”,隨后被新浪等門戶網(wǎng)站轉(zhuǎn)載。
這條新聞在國(guó)內(nèi)似乎未引起太大影響,但很快有身居美國(guó)的朋友指出,波士頓根本沒發(fā)生這類案件。倒是美聯(lián)社當(dāng)天發(fā)布了一條波黑薩拉熱窩發(fā)生槍擊案的新聞,除了地點(diǎn)外,與上文各種細(xì)節(jié)完全一致。初步判斷是,中新網(wǎng)把“波斯尼亞-黑塞哥維那”錯(cuò)誤地翻譯成“波士頓”,把槍擊案地點(diǎn)挪到了7000公里之外。
舉出上述例子并非幸災(zāi)樂禍、或是以“行業(yè)警察”自居,而是因?yàn)槲矣纱寺?lián)想到了近幾年來逐漸火爆的另一個(gè)行業(yè)話題:機(jī)器人寫稿。日益強(qiáng)大的計(jì)算能力和大數(shù)據(jù)分析能力,結(jié)合機(jī)器學(xué)習(xí)方面的技術(shù)進(jìn)展,已經(jīng)令電腦程序可以取代新聞從業(yè)者的一些職能,并且讓國(guó)內(nèi)外不少新聞業(yè)同行感到緊張。那么,這些技術(shù)是否也可以幫助新聞機(jī)構(gòu)避免此類令人尷尬、誤導(dǎo)讀者甚至可能造成巨大損失的事實(shí)錯(cuò)誤?
以我對(duì)“機(jī)器人寫稿”技術(shù)發(fā)展至今的觀察,它似乎主要作用在傳統(tǒng)新聞采編流程中的三個(gè)節(jié)點(diǎn):
一是信息的采集。在信息爆炸的時(shí)代,新聞行業(yè)早已開始通過電腦程序篩選信息,捕捉海量信息中的“突發(fā)”和“異動(dòng)”,發(fā)現(xiàn)新聞線索。例如,駐華外國(guó)財(cái)經(jīng)媒體早在十幾年前就開始用類似網(wǎng)絡(luò)爬蟲的軟件實(shí)時(shí)監(jiān)控關(guān)鍵政府、機(jī)構(gòu)、企業(yè)網(wǎng)站和數(shù)據(jù)庫,尤其是央行、財(cái)政部、統(tǒng)計(jì)局等定期發(fā)布的宏觀經(jīng)濟(jì)數(shù)據(jù)。相關(guān)數(shù)據(jù)庫、網(wǎng)頁一旦有更新,這些軟件立即以郵件、手機(jī)短信或電腦桌面“紅條”的形式通知記者處理。財(cái)經(jīng)類通訊社間對(duì)發(fā)稿時(shí)效、第一時(shí)間影響市場(chǎng)能力的競(jìng)爭(zhēng),往往精確到秒甚至毫秒;比起更早時(shí)候新聞助理們整天眼巴巴地盯著新華社電訊終端,或者用鼠標(biāo)手動(dòng)刷新網(wǎng)站,爬蟲軟件顯然高效、人性得多。
時(shí)至今日,社交媒體日益成為新聞線索的最快、最廣來源,監(jiān)控分析社交媒體動(dòng)向和趨勢(shì)的軟件更是不斷推陳出新,很多技術(shù)能力強(qiáng)大的新聞機(jī)構(gòu)更是自行開發(fā)相關(guān)軟件,直接接入自己的內(nèi)容管理系統(tǒng)(CMS)。
當(dāng)然,近幾年來最為吸引業(yè)內(nèi)和大眾眼球的還是人工智能技術(shù)在“寫稿”環(huán)節(jié)的應(yīng)用。就目前的發(fā)展看,這一功能的基本原理其實(shí)并不復(fù)雜:對(duì)于一些相對(duì)格式化、以數(shù)據(jù)為核心內(nèi)容的新聞(例如財(cái)經(jīng)、體育新聞),記者編輯們可以先準(zhǔn)備好相對(duì)固定模板,其中的變量(時(shí)間、地點(diǎn)、數(shù)據(jù)等)可以隨時(shí)由上文提到的由爬蟲軟件獲取的最新數(shù)據(jù)所代替,從而生成最新的報(bào)道。
據(jù)我所知,彭博社、路透社等財(cái)經(jīng)新聞機(jī)構(gòu),至少在四五年前即已自行開發(fā)相關(guān)軟件,以多半自動(dòng)、少半人工的形式生成并發(fā)布格式簡(jiǎn)單的財(cái)經(jīng)新聞。類似技術(shù)近年來在國(guó)內(nèi)外新聞機(jī)構(gòu)間不斷改進(jìn)升級(jí),也在大眾中引起了越來越高的興趣。
以今年9月份在國(guó)內(nèi)媒體圈轟動(dòng)一時(shí)的騰訊財(cái)經(jīng)“8月CPI同比上漲2.0% 創(chuàng)12個(gè)月新高”這篇新聞稿為例:
“騰訊財(cái)經(jīng)訊 國(guó)家統(tǒng)計(jì)局周四公布數(shù)據(jù)顯示,8月CPI同比上漲2.0%,漲幅比7月的1.6%略有擴(kuò)大,但高于預(yù)期值1.9%,并創(chuàng)12個(gè)月新高。
國(guó)家統(tǒng)計(jì)局城市司高級(jí)統(tǒng)計(jì)師余秋梅認(rèn)為,從環(huán)比看,8月份豬肉、鮮菜和蛋等食品價(jià)格大幅上漲,是CPI環(huán)比漲幅較高的主要原因。8月份豬肉價(jià)格連續(xù)第四個(gè)月恢復(fù)性上漲,環(huán)比漲幅為7.7%,影響CPI上漲0.25個(gè)百分點(diǎn)。部分地區(qū)高溫、暴雨天氣交替,影響了鮮菜的生產(chǎn)和運(yùn)輸,鮮菜價(jià)格環(huán)比上漲6.8%,影響CPI上漲0.21個(gè)百分點(diǎn)。……”
其中CPI和各種商品價(jià)格的同比、環(huán)比漲跌數(shù)據(jù),都可以由“爬蟲”從國(guó)家統(tǒng)計(jì)局網(wǎng)站上獲取,填入事先準(zhǔn)備好的模板中。騰訊財(cái)經(jīng)此文還引用了多位分析師的觀點(diǎn),估計(jì)是采用了更加復(fù)雜的預(yù)設(shè)模板和邏輯判斷,并且可能最后仍需一定程度的人工干預(yù)(編輯)。
第三個(gè)節(jié)點(diǎn)是新聞機(jī)構(gòu)生產(chǎn)出的內(nèi)容的智能發(fā)布。例如《紐約時(shí)報(bào)》開發(fā)的Blossom程序,通過大數(shù)據(jù)分析確定哪些內(nèi)容更適合發(fā)布到社交媒體平臺(tái)。這個(gè)節(jié)點(diǎn)似乎與本文討論的內(nèi)容關(guān)系不大。
那么,問題來了:如果隨著機(jī)器學(xué)習(xí)能力的提高,上文提到的“抓取信息+填充模板”的機(jī)器人寫稿形式逐漸擴(kuò)大到更多的領(lǐng)域,適應(yīng)更復(fù)雜的情況,它能否同樣具有強(qiáng)大的“防錯(cuò)”和“糾錯(cuò)”功能?“機(jī)器人記者”除了比肉身記者更加快捷外,還能夠更加準(zhǔn)確嗎?
從理論上看,機(jī)器人記者的準(zhǔn)確度似乎可以完勝人類記者。
首先,用爬蟲類軟件從權(quán)威信息來源處搜取的信息和數(shù)據(jù),在轉(zhuǎn)換成為新聞產(chǎn)品的過程中極大減少了人為誤抄錄的可能。在翻譯問題上,盡管不同語言間的機(jī)器翻譯仍舊不能完全替代人工翻譯,但各種電腦輔助的翻譯工具已經(jīng)可以實(shí)現(xiàn)數(shù)字、拼寫、語法、專有名詞、上下文一致性等多種內(nèi)容的翻譯和校對(duì),上文提到的把電話號(hào)碼誤做死亡人數(shù),或是“波黑-波士頓”一類低級(jí)翻譯錯(cuò)誤可以輕易被電腦翻譯工具發(fā)現(xiàn)并糾正。
當(dāng)然,準(zhǔn)確程度也極大地取決于計(jì)算能力和軟件的完善程度。四年多前,我所供職的一家國(guó)際財(cái)經(jīng)通訊社為了提高對(duì)中國(guó)宏觀經(jīng)濟(jì)數(shù)據(jù)報(bào)道的速度,開始試驗(yàn)以軟件從政府網(wǎng)站調(diào)取最新數(shù)據(jù),并自動(dòng)以簡(jiǎn)單的新聞模板發(fā)布。但是,試驗(yàn)開始不久,就出現(xiàn)了一次重大事故:搜索軟件誤將政府網(wǎng)站上一個(gè)月前的舊頁面當(dāng)做更新頁面,將數(shù)據(jù)調(diào)取后形成快訊稿,并且未經(jīng)編輯核實(shí),直接發(fā)到到客戶終端,引發(fā)不少客戶投訴,萬幸未造成重大投資損失。時(shí)至今日,盡管軟件的復(fù)雜程度和計(jì)算能力已有巨大進(jìn)步,機(jī)器應(yīng)對(duì)種種復(fù)雜的現(xiàn)實(shí)情況的能力、尤其是學(xué)習(xí)能力,仍舊是關(guān)鍵。
其次,在信息來源的甄別和核實(shí)方面,電腦的強(qiáng)大處理能力也有助于大幅提高準(zhǔn)確性。
在浩如煙海的政府、機(jī)構(gòu)、企業(yè)、媒體網(wǎng)站和數(shù)據(jù)庫、個(gè)人網(wǎng)站和社交媒體賬號(hào)等等之中,如何判斷哪個(gè)是“權(quán)威”、“可靠”的新聞來源?目前已知的和可以想象的做法,包括通過對(duì)海量歷史內(nèi)容的檢索和互相驗(yàn)證,形成對(duì)信息來源可靠性的評(píng)判;判斷某一“新聞事件”是否真正發(fā)生,可以監(jiān)控與之最相關(guān)領(lǐng)域的媒體、個(gè)人和機(jī)構(gòu)的反饋,尤其通過那些可信度較高的個(gè)體的反饋加以判斷;甚至依據(jù)地理位置,從周邊大量個(gè)人社交媒體賬號(hào)的反應(yīng)得出判斷… 這些依賴于強(qiáng)大的數(shù)據(jù)處理和分析能力的工作,電腦顯然都比人更加勝任。
但是,人類記者和機(jī)器人記者最大的區(qū)別出現(xiàn)了:除了相對(duì)被動(dòng)地搜尋現(xiàn)存信息以外,人類記者還可以主動(dòng)調(diào)查和核實(shí)信息:聯(lián)系當(dāng)事人、可能的知情人或相關(guān)專家,通過人際交流實(shí)現(xiàn)對(duì)信息的證實(shí)或證偽。新聞歸根到底是為人類服務(wù)的,人類記者的最大價(jià)值也就體現(xiàn)在人際交流的能力。除非電腦演進(jìn)到可以與人類主動(dòng)、無障礙地交流,甚至通過智慧、心理的較量從人類身上獲得后者本來不愿提供的信息,這將成為人類記者不可替代的最后一塊陣地。當(dāng)然,如果電腦真的發(fā)展到全面“智壓人類”的地步,那也就是“天網(wǎng)”統(tǒng)治世界、毀滅人類的時(shí)候了。
至于在常識(shí)、直覺、同理心(empathy)、感召力、職業(yè)道德等等對(duì)于廣義的新聞工作具有重要意義的能力和素質(zhì)方面,更是很難想象電腦能夠在可見的未來替代人類。
這樣看來,依據(jù)遠(yuǎn)超人類的強(qiáng)大計(jì)算能力來獲取、篩選和分析數(shù)據(jù)是機(jī)器人的強(qiáng)項(xiàng),新聞業(yè)與之相關(guān)的工作也正在被電腦不斷取代,這對(duì)新聞行業(yè)整體的時(shí)效、準(zhǔn)確、客觀性提升大有幫助;但是,在可見的未來,即便是在純粹事實(shí)性的新聞報(bào)道中,電腦仍舊難以完全取代人類記者。
也許未來的新聞機(jī)構(gòu)不再需要?jiǎng)虞m幾十人、數(shù)百人的“大平面”辦公室,會(huì)在一定程度上以大型服務(wù)器機(jī)房甚至是“云計(jì)算”取而代之,但在一些關(guān)鍵的、具有高附加值的環(huán)節(jié)上,經(jīng)驗(yàn)豐富的人類記者編輯仍舊將占據(jù)核心的地位。諸如觀點(diǎn)、分析、評(píng)論、調(diào)查等更加復(fù)雜、涉及人類主觀意識(shí)的新聞形態(tài),在未來很久一段時(shí)間內(nèi)都必須仍舊由人類記者編輯負(fù)責(zé)——除非這些形態(tài)乃至傳統(tǒng)意義上的新聞行業(yè),因?yàn)槭袌?chǎng)需求的變遷而先行消亡。
在新聞這樣一個(gè)面臨巨大沖擊的行業(yè),上述結(jié)論未必能給從業(yè)者多少安慰。但是至少,它提醒我們不能放松職守。電腦會(huì)讓我們中的很多人失業(yè),但不會(huì)是全部;電腦替我們做了很多累活苦活,但最重的責(zé)任,仍舊需要我們來承擔(dān)。
說到這里,是否可以請(qǐng)中新社和新浪網(wǎng)至少把“波士頓槍擊案”的錯(cuò)誤網(wǎng)頁刪掉?(文章來源:FT中文網(wǎng))