相關閱讀 |
>>> 技術話題—商業文明的嶄新時代 >>> | 簡體 傳統 |
微軟在 Windows 8.1 和 Windows Phone 8.1 中的 IE11 瀏覽器中加入了“閱讀模式”(Reading View)功能。閱讀模式可以將網頁主題內容抽取出來,并用新的預置樣式將其重新排版,讓用戶可以更專注地閱讀內容。
然而,閱讀模式功能得益于微軟研究院的技術積累 – 在 11 年前,現在的微軟亞洲研究院主管研究員宋睿華開始了“網頁分區”和“學習網頁模板”的研究。前者,網頁分區是研究網頁分區的重要性,通過機器將網頁劃分出不同分區,并判定分區的重要度。后者,是讓機器學習網站模板,找出不同網頁相似的部分,利用這些規則抽取其他網頁的分區的重要度。
但在 2012 年微軟產品團隊找到他們的研究成果后,發現結果并不理想,重新寫了一套算法,究其原因有兩點:一方面,HTML 代碼的變化巨大,另一方面,做研究與做產品的復雜性的差別。微軟研究院稱新的文字抽取算法“準確率很高,并可以抽取圖片”。
在文章中,微軟研究院稱微軟產品團隊本打算通過第三方公司的專利來實現閱讀視圖功能,但微軟未指明的“內部的機制”,得以讓微軟能用上研究院的內部技術。正如 Cortana 背后的技術,微軟研發團隊并不會有產品化的壓力,而產品團隊在需要技術時又能很快找到研究成果直接拿來用。(via 微軟亞洲研究院)
網載 2014-07-02 15:25:27
稱謂:
内容: