(1)今天大概有1000個頭條服務器,通過代碼實現的爬蟲功能,抓取其他媒體的網站和門戶網站的各類信息。如果在網站上抓取紙媒內容,則首先從紙媒門戶抓取信息。
(2)抓取信息後,通過算法對有價值的信息進行分析和分類。
(3)推送到有趣頭條客戶端。
(4)在用戶註冊或登錄(新浪微博、QQ、人人網)時,通過數據挖掘分析對用戶進行分析,推薦感興趣的信息。
(5)推送後,根據用戶體驗(閱讀時間、評論)判斷信息是否符合客戶需求,進而進壹步調整推送的信息內容。