(Ps:切掉的新書已更新過章節内容不可能放這本,沒那麽喪心病狂,隻是搜索引擎名字引用了“靈境搜索”,因爲想了幾個名字都覺得沒這個合适,現在人工智能和GPT那麽熱,正好2013年是生物識别技術和神經網絡開始爆發的年頭,本來AI的劇情就是從本書大綱挪過去,不在本書展開,新書嘎了,那邊也還沒展開,所以調整回來,但已經更新了的章節内容是絕對不會發第二次。)
——
陳宇說到這裏順手關掉了會議大屏幕的PPT,轉而看向衆人說:“AI語言大模型的建構,後面的一大工作重點就是數據投喂,底層算法架構雖然不是基于自然語言處理NLP,但毫無疑問也受其影響,接下來的數據投喂首先是把互聯網上已有的公開數據截止2012年之前産生的存量數據信息都給我爬一遍,國内國外的都要爬。”
這等于是白嫖全人類千百年來所積累的絕大部分知識。
一位與會的工程師詢問道:“每天大約要爬取多少數據量?”
陳宇言簡意赅:“5個PB左右。”
5個PB?
衆人都是一陣驚愕,5個PB的數據量換算一下就是500多萬GB的數據量,互聯網巨頭谷歌在2008年每天處理的數據量大約是20個PB左右,相當于是其四分之一的數據處理量。
這是一項大工程,而且超級消耗算力資源,換句話說就是燒錢啊,光是網費就要一大筆開支。
陳宇轉而說道:“此外,叟狗搜索開發新版本大更新,新版本推出之後更名爲靈境搜索,等到用戶完全适應習慣了,叟狗搜索這個名字就棄掉。”
新版本上線初期,叟狗搜索的名字還是會保留的,用戶若是輸入叟狗搜索引擎的時候會跳轉顯示爲靈境搜索,并且要有标記這是改名後的叟狗搜索。
告訴老用戶,叟狗還是那個叟狗,名字改了而已。
現在肯定不能直接用靈境搜索這個名字,那會丢掉好多老用戶,叟狗這個名字還是需要保持一段時間的,等靈境搜索的知名度和影響力覆蓋了叟狗就可以徹底放棄這個名字。
此時此刻,旁聽的方鴻翹着個二郎腿一言不發的聽着。
陳宇繼續道:“對于新版本靈境搜索,簡而言之就是,更簡潔、更精準、更舒适。靈境GPT成熟的那天便會接入靈境搜索,這是颠覆當代搜索引擎的一大重要倚仗。”
“也許颠覆百渡乃至谷歌的可能不是靈境搜索,但毫無疑問的是,AI技術的進步必然會改變人們訪問信息的方式。”
“而我所想象的方式是,浏覽器的搜索欄被人AI取代,在我輸入時,AI會自動完成我的想法或問題,同時給我提供最佳答案,這個答案可能是一個網站或産品的鏈接,AI用舊的搜索引擎後端來收集相關信息和連接,然後爲我彙總。”
“這種颠覆方式就在于像是讓一個專業的研究人員來做這項工作,隻不過AI會立刻完成,而人類需要花費數分鍾乃至更久才能完成。”
用戶自己去搜索内容的時候,還得去篩選、尋找,有時候非常耗時,而如果有AI的幫助就不一樣了,直接問AI即可,它馬上秒秒鍾就給用戶提供最佳答案。
想要達到這種效果,那就需要超級龐大的算力資源,以及AI足夠“聰明”或者說能夠更加精準的理解人類的“語言”才能提供精準的答案。
顯而易見,首先就需要讓AI把人類千百年來積累的知識都掌握了。
先去把那些數據爬一遍再說,這是能夠針對任何用戶提出的任何問題并快速給出精準答案的前置條件之一。
此刻,陳宇看着衆人說道:“衆所周知,搜索廣告通過關鍵詞引流,非常精準,轉化效果高。但作爲搜索廣告本身,更依賴于用戶自發的搜索行爲,導緻其覆蓋面存在一定的局限性。每月的搜索量雖然有增有減,但一般都是有限的。”
“搜索頁面的訪問量占總訪問量的多少?”陳宇說着便看向其中一位與會的負責人,他是前叟狗的員工,現在已經來到公司總部,聽到陳宇詢問他立馬回答:“占比大約在8~11%左右。”
聞言,陳宇點了下頭便接着道:“這就意味着,當你是經營一個冷門産品的時候,或者想要獲得更多的廣告覆蓋的時候,搜索廣告可能無法給予太多的幫助,所以我們需要個性化的展示廣告。”
“如果說搜索廣告是通過用戶的搜索行爲決定什麽廣告會出現,那麽個性化的展示廣告則是‘猜’用戶對什麽感興趣就推薦什麽廣告。”
“個性化推薦需要新技術的支持,除此之外用戶畫像也很重要,這就需要積累豐富的用戶數據,比如用戶經常搜索什麽、偏好等因子。”
“關于個性化推薦的技術支持後頭在說,這裏先說說個性化廣告展示的位置顯示問題。”
“新版本靈境搜索分左右兩個部分的詞條,左邊的詞條顯示搜索關鍵詞内容,右邊顯示‘猜’用戶喜歡的個性化展示廣告,每頁最多含有5個廣告位,不足5個的則廣告将會在每頁都展示,超過5個的則按序循環出現。”
現在的那些搜索引擎,體驗是真的一言難盡,用戶想搜索到自己想找的内容要花費很多時間。
因爲強行“猜”你喜歡把展示廣告甩你一臉,而且國内的搜索引擎還不标注這是廣告,點進去一看才發現是廣告。
至于被用戶诟病吐槽的競價排名就不用說了。
新版本的靈境搜索,按照陳宇的要求,搜索廣告和展示廣告必須分開,左邊都是用戶自己搜索生産的詞條,右邊上半部分是“猜”用戶喜歡的展示廣告内容。
至于右邊下半部分留白,暫時沒有任何内容,以後在這裏新增一個熱搜榜。
毫無疑問,減少用戶搜索内容的時間成本就是用戶體驗的提升,同時能夠更精準的顯示用戶要找的内容也是如此,當然這就是核心技術問題了。
除此之外,爲了提高用戶體驗,陳宇也要求對靈境搜索的廣告主的廣告内容提高限制,摒棄諸多劣質廣告,支持優質的廣告内容。
這樣肯定會少賺很多錢,好多金主就直接沒了。
改版後的靈境搜索的盈利能力可能會比原叟狗搜索要大幅下滑。
此刻,與會旁聽不語的方鴻不禁自顧自地點頭,他猜的沒有錯,陳宇果然不是一時興起要做搜索引擎。
陳宇的目光長遠,不在乎這點蠅頭小利,這一點與方鴻不謀而合,這點小小利潤他就更不在乎了。
一個更牛、體驗更好的産品賺錢能力絕對不會差,隻不過前期需要忍受不賺錢乃至虧錢的局面,這一點量化資本沒有問題,陳宇本身就能在資本市場賺到錢。
要是還不夠,這不是還有母公司群星資本,坐在旁邊一言不發的大BOSS會出手。
……
(本章完)