免費偷竊你的創作內容

誰在爬你的資料？

作者：布蘭登 Brandon 發布日期： 2023-07-08最後更新於： 2025-10-21 0 分鐘閱讀

Google悄悄地更新了隱私權政策（2023/7/1生效），其中一條是把：

「Google會爬取公開資料來訓練語言模型，並打造如Google翻譯這類的功能。」

改成：

「Google會爬取公開資料來訓練AI模型，並打造如Google翻譯、Bard (aka Google 的ChatGPT)、Cloud AI 這類的產品與功能。」

也就是說，你在網路上發表的任何公開內容，Google會瘋狂地爬，並且用它們來改善自家產品。

天啊！這是利用網路免費資源的極致了吧！你寫的內容只要公開，抱歉，Google都可以拿來用。

Twitter正巧在上個禮拜更改了瀏覽限制，一定要登入才能觀看Twitter的內容，就是為了對抗爬蟲訓練AI，隨心所欲地獲得Twitter上的資料。

數據隱私與個資保護，一直是網路世界的痛點，這也是Threads還沒進入歐洲的原因之一。。

用戶要使用平台服務，一定都會先同意服務條款，通常裡面就會告訴你「我會用你的資料」。你同意嗎？不同意？抱歉，那就別用了。

然而今天變成是，你只要在網路世界公開留下什麼，都會變成訓練AI模型的免費資源。這已經是連強迫使用者同意這件事都不做了。

在AI崛起的時代，隱私和數據的議題再次被放大。

我認為為如何防止任何人免費爬取資料，會是接下來科技發展的大議題，像是Wordpress外掛、任何平台，都可能會推出防止未經同意禁止爬取資料，或是爬取資料要付費給內容創作者的功能。

未來私域化的觀念，我認為只會日漸增強。

任何服務只要搭上羊毛出在羊身上的概念，要爬創作者的創作資料就要付錢給創作者，在未來都有機會吸引大量用戶。

Hi，我是 Brandon，我在這裡分享我的科技觀點、閱讀學習、創業日記，挖掘科技新知以及探索人生，和你一起成為更好的自己。