Tumblr 是如何推薦內容的

Tumblr 是一個數位社群，一部分由微型部落格組成，另一部分的組成則是社群網路，人們到這裡來分享共同的興趣，透過真誠的對話交流來慶祝構想和藝術。在
Tumblr
上的體驗仰賴於我們的關鍵價值，如社群、隱私權、真實性、自由表達、使用者對數位體驗的控制…等。我們讓創作者可以創作他們的最佳作品，並把作品呈現在他們所值得的觀眾面前。

作為這個概念的一部分，我們的補給文希冀能為每位使用者提供高品質、安全、娛樂、具啟發性、有相關性的內容。我們提供多種不同的補給文，包括一個以來自使用者已追蹤蒐集的部落格和標籤清單的內容為基礎的補給文，而另一個則是根據目前潮流，以及我們相信使用者可能會感興趣的內容類型而動態性提供的內容。為了開發這些補給文，我們採用多樣化的內容個人化技術和訊號，包括使用者的情報中心喜好設定。如要深入了解各種補給文類型，以及我們是如何選取及排列要呈現在補給文之內的內容，請繼續閱讀下去。

補給文

我們支援不同的消費體驗，大部分是透過三個分頁；

追蹤中

在這個空間中，我們大部分會展示來自使用者所追蹤之部落格的內容。使用者對於他們的體驗採取主動性的角色，他們可以自訂他們要追蹤的部落格，也可以針對他們不想看到的內容提供意見反應（譬如說篩選掉來自特定部落格和標籤的內容）。

我們偶爾也會提供以下的建議：

可追蹤的部落格（「來看看這些部落格」）。這些推薦是根據追蹤關係（使用者最近開始追蹤的部落格有追蹤的一些部落格，這些會被標示為「相似的追蹤軌道」或「神似於你追蹤的部落格」）和內容相似性（有分享與使用者最近互動的內容相似的內容的部落格，這些會被標示為「你說不定會有興趣」）。我們不會推薦使用者先前有解除、檢舉、封鎖或最近已取消追蹤的部落格。使用者可以透過與部落格和內容互動來影響部落格推薦，或是透過使用在貼文右上角的貢丸選單
(●●●)、封鎖和/或取消追蹤部落格來解除一項特定的推薦內容。
可追蹤的標籤（「來看看這些標籤」）。對於這些推薦內容我們會考量不同標籤之間的關係（例如經常被連帶使用的標籤），以及與使用者最近互動的內容有所關聯的標籤。使用者與內容的有機互動會影響到推薦的標籤，就連封鎖標籤也都會造成影響，因為我們不會推薦使用者先前有封鎖過的標籤。
貼文，包含那些來自尚未追蹤的部落格的貼文。這些貼文來自不同的來源，以為補給文提供更多樣化的內容，但是我們會限制這些推薦貼文的頻率，以確保「追蹤中」補給文的內容絕大部分都是由使用者追蹤的部落格所創作的內容。每一篇推薦貼文都會標示一項特定的解釋，如此使用者便可輕易辨識。我們所推薦貼文的範例包括：
- 在使用者所追蹤之主題中正潮的貼文（標示為「因為你有追蹤
  #標籤」）。我們會呈現標有使用者有追蹤且最近有互動過的標籤的熱門貼文。使用者可以選擇不要看到這些貼文，只要從他們的情報中心喜好設定中關閉「包含追蹤標籤的貼文」切換開關就可以了。
- 與使用者近期的活動動態相關的貼文（標示為「根據你的喜歡文！」）。我們會展示「相似」於使用者最近有按喜歡的貼文。我們對於相似性的定義是根據互動來決定：如果兩篇貼文都有被同一位使用者互動過，那麼這兩篇貼文就可被視為相似。使用者可以選擇不要看到這類的推薦，只要從他們的情報中心喜好設定中關閉「包括『根據你的喜歡文！』」切換開關就可以了。
- 由使用者追蹤的部落格喜歡的貼文（標示為「@blogname
  喜歡這篇」）。我們集結了使用者追蹤的部落格的「喜歡」活動，並根據以下幾點來推薦內容：（i）使用者追蹤的部落格中有幾個喜歡了該篇貼文（越多越好）；（ii）使用者與喜歡該篇貼文的部落格之間互動的頻率（頻率越高越好）；（iii）該篇貼文的新鮮度（越新越好）。使用者可以選擇不要看到這類的推薦，只要從他們的情報中心喜好設定中關閉「包含你追蹤的部落格有喜歡的貼文」切換開關就可以了。（對於有透過關閉「分享你喜歡的貼文」切換開關來把他們的喜歡文設定為私人的使用者，我們當然不會分享他們的喜歡文，關於這點請參閱隱私權選項。）

對於追蹤中補給文推薦解釋的幾個範例

對於大部分的使用者，自從他們最近一次拜訪之後出現的新內容的量，會傾向多於他們通常能在一次拜訪中瀏覽的量。由於這個原因，我們在追蹤中補給文的預設體驗會根據演算法預測的互動可能性來排行內容。使用者可以選擇不要在追蹤中補給文上運用演算法排行，改為依時間順序排列補給文，只要在他們的情報中心喜好設定中關閉「最精采者優先」切換開關就可以了。

個人推薦

在「個人推薦」補給文上的內容混和了由使用者已追蹤的部落格所創作或轉格的貼文，和來自使用者可能還不知道的來源（可能是部落格或主題）的貼文。

在「個人推薦」補給文中推薦內容時，對於內容的過往偏好和即時偏好，我們會使用不同的訊號來辨識使用者的互動模式。這些訊號包括明確的正面和負面互動，這可以是針對部落格（例如追蹤、封鎖）、貼文（例如喜歡、回覆、轉格、分享、解除）和標籤（例如追蹤、封鎖）的，另外也包含了搜尋查詢和瀏覽活動（例如點按操作）。我們會為這些活動指派不同的重要性權重，明確互動的權重會高於瀏覽活動，因為前者會比較精確地反映出使用者對於內容的個人偏好，而後者可能就會含有比較多雜訊（例如使用者可能會按了一篇他們並不喜歡的貼文）。我們也會考量在執行動作之後已經過了多久，給予最近的互動和活動較高的重要性，如此便可讓我們捕捉到使用者的個人偏好隨著時間的轉變。

我們會把這項對於使用者對部落格、標籤和貼文的個人偏好的了解，用來辨識選取可能會與使用者有關的貼文（從尚未追蹤的部落格中挑選）。我們會透過運用一套不同來源的演算法來實行，每個演算法會使用一小組的訊號和內容相似性定義來專門辨識出相關的候選內容。舉例來說，協同過濾演算法會呈現有類似互動模式（譬如說與同一篇貼文互動過）的使用者所互動過的貼文，而內容導向
(content-based)
機制則會建議內容（譬如說文字資訊、標籤、媒體物件）與使用者的興趣（譬如說使用者所追蹤的標籤、使用者最近有互動過的貼文）類似的貼文。

總歸來說，在「個人推薦」補給文中貼文的順序是由預測使用者將會覺得貼文有吸引力，並且與他們的興趣相關的可能性來決定的。我們也會嘗試確保在這個補給文上的內容反映出廣泛的來源和興趣。

由於在「個人推薦」補給文上的消費體驗是演算驅動的，使用者可以透過與補給文進行有機互動、蒐集他們所追蹤或封鎖的部落格和標籤清單、使用位於貼文右上角的貢丸選單
(●●●) 中的「我對這篇貼文沒興趣」連結來標示不相關的內容，以影響所展示的內容。

你的標籤

這個補給文的用意是要讓使用者有個地方可以跟上與他們追蹤標籤相關的最新最精采的內容。在這個補給文中，貼文的排列順序會平衡新鮮度和熱門程度，以提供混和了新鮮、相關、優質的內容。我們也會展示各個標籤中最熱門的創作者的一些內容，這些內容的篩選是根據創作者近期對於該標籤的貢獻量以及相關的互動量來決定的。如果要修改我們推薦的內容的話，那麼使用者可以管理他們追蹤的標籤、封鎖的標籤，以及將「你的標籤」補給文篩選為只檢視來自某些標籤的內容。

我們如何排列補給文上的內容

補給文的組成通常會遵循以下的程序，其中的有些步驟可能會根據使用者的喜好設定來跳過。

從各種潛在的來源擷取候選貼文，這些來源有由追蹤部落格所創作之貼文的追蹤圖表、聯合篩選出與近期互動過的內容類似的貼文，以及根據與使用者的興趣相符的內容來挑選出的貼文。
套用多個篩選條件以確保內容是可用的（譬如說沒有被刪除，還有貼文和部落格的公開範圍是設為公開的）、有遵守社群規定和成人內容顯示與否設定、尊重使用者對於部落格和標籤的篩選設定，並且使用者先前從未曾互動過。在個人推薦補給文上，我們也會套用一個篩選步驟來移除使用者最近曾看過的貼文，以提昇多樣化和新鮮度。
排列這堆內容的方式必須要能在靠近補給文的頂端提供使用者最有吸引力和相關的貼文，這個階段涉及到預測一個使用者將會覺得特定一篇候選貼文與他們的興趣有關並且有吸引力的可能性，然後依據這個預測來分類候選文。
重新排列結果來改善在補給文中貼文次序的多樣化。先前的階段可能會產生一系列相似的內容（譬如說由同一個部落格所創作，或是有關相同的主題），如此可能會導致不良的使用者體驗。多樣化重新排行可確保在補給文上的貼文次序涵蓋了使用者的不同興趣，並且是來自平衡性的混合來源。

在排行階段期間，我們聯結到各篇貼文的相關性/吸引力會依據多種因素來決定。我們採用機器學習技術來從大量的歷程事件中學習那些因素（特徵）之間的相互作用，如何影響使用者與候選貼文互動的可能性。

雖然我們使用補給文特定的預測模型，並且經常反覆操作這些模型以改善其準確性，我們發現具有較高預測能力的特徵類別傾向於是同樣的，包括：

關於內容創作者的資訊，例如他們受歡迎的程度（譬如說追蹤同好人數）和他們近期活動的程度（譬如說最近創作的貼文數量）；
關於貼文的資訊，例如其類型（轉格文對比原始貼文）、新鮮度、熱門程度（譬如說互動計數，通常會依據互動的類型來分類）、有關貼文內容的資訊（譬如說貼文類型、是否有標籤以及標籤的數量、影像、文字部分的長度）；
關於使用者的資訊，例如他們的興趣以及對於不同貼文內容類型的偏好。
關於使用者和貼文創作者的資訊，例如是否有單方面/雙方面的社群連結（他們有沒有追蹤彼此？）、訂閱（使用者是否有訂閱創作者？），以及使用者對於由貼文創作者所分享之內容的近期互動程度。

使用者對於補給文的控制

我們提供使用者多種方式來自訂他們在 Tumblr 上的體驗，而且我們會即時更新補給文以反應目前的設定。使用者可以：

在追蹤中補給文上選擇依時間先後或是演算法來排行，也就是在他們的情報中心喜好設定中的「最精采者優先」選項。
控制在追蹤中補給文上推薦的貼文，也就是透過在他們的情報中心喜好設定中的「包含追蹤標籤的貼文」、「包括『根據你的喜歡文！』」和「包含你追蹤的部落格有喜歡的貼文」切換開關。
解除推薦的貼文，也就是透過位於貼文右上角的貢丸選單 (●●●) 來選取「我對這篇貼文沒興趣」或「解除」的選項。
封鎖來自特定創作者的貼文。
封鎖含有特定標籤的貼文.
檢舉貼文為垃圾內容或要求進行內容安全性審查，也就是從貼文右上角的貢丸選單中選擇「檢舉貼文」或「建議社群標示」選項。

Tumblr 是如何推薦內容的

導覽

補給文

追蹤中

個人推薦

你的標籤

我們如何排列補給文上的內容

使用者對於補給文的控制

Related Articles