第218章 編寫爬蟲程序
李河川家的車庫雖然是車庫形式,不過其實也算是不錯的環(huán)境了。
車庫也是經(jīng)過裝修的,和地下影視廳以及另外一個車庫構(gòu)成了別墅的半地下層。
倒不是李河川舍不得花錢,而是作為一個男人,得時刻考慮樓上的吳曦月。
從車庫到吳曦月所在的一樓,連一分鐘都用不了,自然是最符合李河要求的地方。
而且前期僅僅是編寫代碼,有個車庫就足夠了。等開始進(jìn)行商業(yè)測試時,再搬遷到正規(guī)的辦公樓。
李河川想好了,目前要做的就是搭建好煤炭交易網(wǎng)的買賣雙方的后臺,這個編碼技術(shù)李河川本身就掌握。
靠著基地車上的后世的黑科技,他的段位要領(lǐng)先這個時代不知多少年。
王瑾看著李河川指揮電腦商將機(jī)器組裝到車庫,心中稍微有些失落。
在之前的時候,她也算是白領(lǐng)中的白領(lǐng),除了擁有二十平方的獨立辦公室外,還有專門的助理,哪里像現(xiàn)在這樣從頭再來?
不過這也讓她充滿了期待,期待從這里李河川帶領(lǐng)她創(chuàng)造新的奇跡。
“那么,你的第一步打算竟然是偷資料?”王瑾睜大了眼睛,沒想到李河川竟然從此入手,似乎有點不道德?
李河川咧嘴一笑,說道:“其實也不算是偷資料了,環(huán)渤海煤炭網(wǎng)上的這些注冊信息本就沒有加密,我不過是扒代碼,將各家的資料提取出來而已。”
做煤炭交易網(wǎng),首先要有數(shù)據(jù),這一點李河川一點都不擔(dān)心,環(huán)渤海煤炭交易網(wǎng)、東北煤炭經(jīng)紀(jì)公司、長三角電力產(chǎn)業(yè)聯(lián)盟、電力資源網(wǎng)上,這些數(shù)據(jù)其實都有,李河川要做的就是用爬蟲程序?qū)⑦@些資料抓取出來,用作自己的平臺上。
就像他之前想的一樣,這些資料分散到全國眾多網(wǎng)站手里面,根本就沒有統(tǒng)合,自然也無法做出精準(zhǔn)的數(shù)據(jù)匹配。既然自己要做交易平臺,那么盡可能多的采集數(shù)據(jù),才會讓平臺數(shù)據(jù)距離實際更近。
當(dāng)煤炭交易網(wǎng)的數(shù)據(jù)精準(zhǔn)到得到了眾多煤企和用戶的關(guān)注后,那么開啟下一步的交易后臺就順理成章了。
王瑾在了解了李河川的想法后,也準(zhǔn)備躍躍欲試,便問道:“那我做點什么?”
“你替我看看曦月需要水果不。”李河川見王瑾已經(jīng)站起來,連忙說道,“我開玩笑的。技術(shù)上的工作不需要你來做,爬蟲程序我來編寫代碼就行,你還是干你原來的老本行。”
“水軍?”
“咳咳,哪能是水軍呢,是宣傳懂不?”李河川看向王瑾,說道,“該不會忘了吧?”
經(jīng)過聊天,李河川知道王瑾辭職的原因了。
原來他們公司接到一份洗白某位領(lǐng)導(dǎo)和女明星緋聞的任務(wù),因為數(shù)額巨大,所以金言公司就承攬下來了,不過這卻觸及了王瑾的底線。
公關(guān)不是不可以,但顛倒黑白就不行了,這是王瑾一直奉行的行為準(zhǔn)則。
和老總協(xié)商不果,在簽署了保密協(xié)議后,王瑾自動辭職了。
正是在這個節(jié)骨眼上,她遇到了李河川。
李河川內(nèi)心深處對這個有性格的美女感到欽佩,心中對與她合伙做事情更是堅定了信心。
“煤炭交易網(wǎng)我準(zhǔn)備用已經(jīng)注冊好的資源雙拼域名,那么你的工作就是盡可能的讓行業(yè)內(nèi)的人關(guān)注這個網(wǎng)站。”李河川說道,“我有信心,只要他們關(guān)注,必然就會被我們的數(shù)據(jù)吸引,那么下一步的注冊和引導(dǎo)就能事半功倍了。”
“我明白了。”王瑾畢竟是做過水軍的,自然一下子就明白了李河川的用意。
本身她就在煤炭行業(yè)摸爬滾打了多年,手頭上就有現(xiàn)成的資源和人脈,做宣傳只需要稍加引導(dǎo),外加五毛黨的狂轟亂炸,肯定能讓煤炭商和客戶注意到這個新網(wǎng)站。
不過因為之前的時候簽過保密協(xié)議,王瑾暫時不能直接用原來工作群來聯(lián)絡(luò)水軍團(tuán)隊,不過這并不影響她用小號逐個完成和原來水軍團(tuán)隊的對接。
看著王瑾忙的不亦樂乎,李河川也不閑著,著手開始編制爬蟲程序。
對李河川的水平來說,編制這樣的程序簡直是太沒成就感了,就好比寫了幾百萬字的網(wǎng)絡(luò)作家,讓他去寫高考作文似的,絕對水的不要不要的。
李河川唯一要做的就是把程序語言壓縮,讓整個爬蟲程序更流暢,更蔭蔽。
畢竟也有可能被某些網(wǎng)站的反爬蟲程序給捕捉到,從而塞進(jìn)來一大堆垃圾數(shù)據(jù)。
王瑾已經(jīng)記錄了不少的資料,而且將李河川給她的一些資料拆散打散,組成一堆看起來毫無關(guān)聯(lián)的外宣文檔,準(zhǔn)備給水軍下任務(wù)時使用。這些工作她駕輕就熟,而且還特意用了海外代理,以防被人追蹤到。
自然,李河川也是在這樣的網(wǎng)絡(luò)環(huán)境中編寫代碼的。
快樂工作時,時間總是過得很快,李河川還意猶未盡時,天已經(jīng)黑了。
李河川的編程進(jìn)展很快,多半天的時間就完成了30的工作量,他相信,再有一天多就能完成了。
想到這個爬蟲將來可能起到的作用,李河川很惡俗的給爬蟲程序起名叫“黑洞”,意思是吸取別人的東西。
李河川在編寫“黑洞”之前,其實心里已經(jīng)有了一套一環(huán)扣一環(huán)的商業(yè)運營計劃。
獲取煤炭資源領(lǐng)域的大數(shù)據(jù)其實只是第一步,這一步并不會產(chǎn)生利潤,只會給他積累前期的數(shù)據(jù),而且爬蟲所爬取的網(wǎng)站越多,得到的數(shù)據(jù)也就越精準(zhǔn),這就為之后的資源交易提供了可供參考的數(shù)據(jù)。
未來,他可是準(zhǔn)備上線交易系統(tǒng)的,而不是僅僅畫一個指數(shù)圖。
作為獲取數(shù)據(jù)的利器,李河川沒準(zhǔn)備私藏,畢竟用的越多,數(shù)據(jù)越精準(zhǔn)。
不過對于他來說,這個不會產(chǎn)生收益,那是因為他的重心不在這里,但對于目前處于煤炭指數(shù)權(quán)威第一序列的環(huán)渤海煤炭指數(shù)網(wǎng)來說,那就不一樣了。
那家公司靠的是煤炭價格市場走勢圖來做的網(wǎng)站,其主要營收就是指數(shù)網(wǎng)上的貼片廣告。
一旦讓人知道,有一個新網(wǎng)站能夠很精準(zhǔn)的反應(yīng)煤炭真實價格,而且遠(yuǎn)比它的精準(zhǔn),那么他的營收將會受到嚴(yán)重沖擊。
一個連數(shù)據(jù)都不準(zhǔn)的網(wǎng)站,會有人去看嗎?
對李河川來說,全新的項目只有他和王瑾兩個人,不可能長期維護(hù)一個爬蟲程序的,更何況,李河川有著龐大的商業(yè)計劃。
所以,李河川早有打算,他給自己準(zhǔn)備了兩套方案。
</br>
</br>