第49章 語音互譯問世
這一年,許弋往返于學(xué)校和公司之間,帶著他的團(tuán)隊(duì),逐漸搭建起人工智能語音互譯應(yīng)用。
團(tuán)隊(duì)之中同樣也出現(xiàn)了一個(gè)優(yōu)秀的應(yīng)用工程師。
馬威,畢業(yè)于江城市的華中理工大學(xué)網(wǎng)絡(luò)工程專業(yè),畢業(yè)后在夏威做了五年,五年之內(nèi)做到了某個(gè)項(xiàng)目的技術(shù)骨干;但夏威的高強(qiáng)度的工作也幾乎耗竭了他的青春,過早的面臨中年危機(jī)的他不得已只能選擇一家有潛力,能夠自我發(fā)揮的公司發(fā)展。
馬威等人一進(jìn)入未央科技公司,就接觸了許弋開發(fā)的漢語言程序編譯器和匯編語言,著手開發(fā)人工智能語音互譯,在許弋的帶領(lǐng)下,經(jīng)過近一年的努力,一款能夠翻譯語音字幕的人工智能語音互譯軟件的雛形漸漸浮出水面。
于此同時(shí),未央電氣工程公司也沒有停下發(fā)展的腳步,在近一年的時(shí)間里瘋狂擴(kuò)張,打通了從夷陵三峽水電站到申城的無線輸電通道,形成了從夷陵到申城的橫跨長(zhǎng)江中下游沿岸的密集的無線輸電網(wǎng)絡(luò),源源不斷地為沿線的各大城市輸送能源。
鄂、皖、蘇三地樞密院甚至簽署合作協(xié)議,以夷陵三峽水電站的能源合作,借此疏浚長(zhǎng)江河道,承接?xùn)|部地區(qū)的人口和工業(yè)產(chǎn)業(yè)轉(zhuǎn)移。
其實(shí)江城市的資源稟賦極其不錯(cuò),背靠江漢平原,又有能夠通航五大洲的長(zhǎng)江水道,幾乎就是夏國(guó)內(nèi)地唯一一個(gè)能夠?qū)崿F(xiàn)通江達(dá)海,能夠與沿海地區(qū)匹敵的沿江工業(yè)城市。
樞密院的經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)發(fā)現(xiàn),2018年江城市的地區(qū)生產(chǎn)總值增長(zhǎng)了超過30%,高達(dá)19917萬億,一舉超過壓在江城市樞密院頭上多年的蓉城和夔州,直逼姑蘇城;但人口數(shù)量方面確沒有明顯增加。為此鄂省樞密院加大了開發(fā)江城市的力度九省通衢,地區(qū)生產(chǎn)總值突破兩萬億指日可待!
屆時(shí),江城市將成為夏國(guó)中部地區(qū)率先達(dá)到發(fā)達(dá)城市的城市,鄂省也將在夏國(guó)的經(jīng)濟(jì)版圖中更進(jìn)一步。
無線輸電技術(shù)的突破及市場(chǎng)化應(yīng)用,讓江城市爆發(fā)了一輪小規(guī)模的產(chǎn)業(yè)革命,老舊的電網(wǎng)得到改造。
江城市甚至喊出了口號(hào):爭(zhēng)做無線時(shí)代先驅(qū),打造長(zhǎng)江中游城市群。
無線時(shí)代指的是無線輸電技術(shù),長(zhǎng)江中游城市群則是鄂省樞密院決策者決心要以江城為核心,重點(diǎn)發(fā)展鄂東地區(qū)的四個(gè)城市(江城、鄂城、黃州、大冶)來承接?xùn)|部地區(qū)的產(chǎn)業(yè),最終沿著長(zhǎng)江沿岸,形成連片的、產(chǎn)業(yè)密集的城市都會(huì)區(qū)。
這樣一來,江城市的中心地位幾乎不可撼動(dòng),也必然會(huì)成為發(fā)達(dá)城市。
當(dāng)然,也成為發(fā)達(dá)城市,怎么能少的了互聯(lián)網(wǎng)的加持!
……
“我們這款是不同于市面上的翻譯軟件的,市面上的翻譯軟件不能翻譯語音,而且詞不達(dá)意,但這個(gè)可以。”許弋在一旁指導(dǎo)著導(dǎo)馬威。
“這款軟件你們也努力很久了編譯的,試試看它的邏輯是否成功吧!“
說著許弋打開事先編譯的程序,開始展示著。
“你們誰英語比較好的,說一句試試?”
“我來吧!”馬威團(tuán)隊(duì)成員之一的李鵬自告奮勇的上前。
“宮廷玉液酒。”
語音助手用溫柔的女聲進(jìn)行了翻譯:“Imperial jade liquor!“
眾人豎起了大拇指,牛啊!這個(gè)翻譯有水平,很生猛!
雖然翻譯的有些不到位,不過從測(cè)試程序可以看出來語音互譯的雛形已經(jīng)完備,這種翻譯水平已經(jīng)達(dá)到了某些三四流翻譯軟件的水平。
而眾人的主要任務(wù)就是收集數(shù)據(jù),讓翻譯軟件“學(xué)會(huì)”英語。
為什么是“學(xué)會(huì)”呢?
這是因?yàn)榉g軟件的算法決定的,這款軟件采用的分類思維,將每個(gè)詞語設(shè)定為一個(gè)坐標(biāo),并且分類為名詞、動(dòng)詞、助詞等。
將詞語設(shè)定為坐標(biāo)的好處就是將長(zhǎng)難句進(jìn)行肢解,翻譯軟件處理時(shí)就可以將每個(gè)詞語準(zhǔn)確翻譯。
接下來就是按照語言的語境進(jìn)行篩選組合,將不同的翻譯對(duì)象需要的語法和含義進(jìn)行組合,并對(duì)缺少的要素補(bǔ)足。
這就是許弋手里的翻譯軟件的邏輯。
但現(xiàn)在許弋手里的這款翻譯軟件還是有不完美的地方——數(shù)據(jù)不足。
數(shù)據(jù)不足的話,這款軟件翻譯功能就不完善。
它需要像個(gè)孩子一樣,通過學(xué)習(xí)某種語言直到學(xué)會(huì)了的話才能進(jìn)行準(zhǔn)確的翻譯工作。
所以,現(xiàn)在的主要的工作就是讓翻譯軟件進(jìn)行學(xué)習(xí)——錄入、收集數(shù)據(jù)工作。
“我們需要花一個(gè)星期的時(shí)間,讓翻譯軟件學(xué)會(huì)英語。”許弋開始安排各位的工作。
“好的!”眾人激動(dòng)不已,一旦完成,就意味著一款前所未有的翻譯軟件即將從他們手上誕生。
眾人開通過網(wǎng)絡(luò)尋找大量的資料,收集數(shù)據(jù)和搭建服務(wù)器。
接著在各大網(wǎng)絡(luò)直播間都開始出現(xiàn)了未央帶尾標(biāo)的ID,只看直播不發(fā)言。
李鵬和吳明還收集了大量的美劇和好萊塢大片,在電腦上掛著語音互譯軟件播放一遍,用來收集數(shù)據(jù)。
由于大家都在看電影看直播,一度惹的同一樓層的其它公司以為這里是某個(gè)富二代盤下來給手下的小老弟們聚會(huì)的地方。
在某個(gè)直播間,一個(gè)剛直播的新人在直播了一周以后終于迎來了一個(gè)叫未央233的觀眾。
女主播在直播間搔首弄姿的叫著未央哥哥要打賞,就差沒脫衣服了。
要是她知道未央233只是一個(gè)收集數(shù)據(jù)的端口會(huì)不會(huì)氣的全身脫光。
按照公司的光纖傳輸速度及語音互譯軟件收集文件及音頻的速度,預(yù)計(jì)需要一周的時(shí)間。
在期間(收集數(shù)據(jù)開始前半個(gè)小時(shí)),許弋檢查語音互譯軟件的運(yùn)行。
很快,在某一個(gè)平靜的工作日的上午,未央科技公司低調(diào)地在應(yīng)用平臺(tái)上發(fā)布了人工智能語音互譯。