356 
Source: Google
Google悄悄地更新了隱私權政策(2023/7/1生效),其中一條是把:
「Google會爬取公開資料來訓練語言模型,並打造如Google翻譯這類的功能。」
改成:
「Google會爬取公開資料來訓練AI模型,並打造如Google翻譯、Bard (aka Google 的ChatGPT)、Cloud AI 這類的產品與功能。」

也就是說,你在網路上發表的任何公開內容,Google會瘋狂地爬,並且用它們來改善自家產品。
天啊!這是利用網路免費資源的極致了吧!你寫的內容只要公開,抱歉,Google都可以拿來用。
Twitter正巧在上個禮拜更改了瀏覽限制,一定要登入才能觀看Twitter的內容,就是為了對抗爬蟲訓練AI,隨心所欲地獲得Twitter上的資料。
數據隱私與個資保護,一直是網路世界的痛點,這也是Threads還沒進入歐洲的原因之一。。
用戶要使用平台服務,一定都會先同意服務條款,通常裡面就會告訴你「我會用你的資料」。你同意嗎?不同意?抱歉,那就別用了。
然而今天變成是,你只要在網路世界公開留下什麼,都會變成訓練AI模型的免費資源。這已經是連強迫使用者同意這件事都不做了。
在AI崛起的時代,隱私和數據的議題再次被放大。
我認為為如何防止任何人免費爬取資料,會是接下來科技發展的大議題,像是Wordpress外掛、任何平台,都可能會推出防止未經同意禁止爬取資料,或是爬取資料要付費給內容創作者的功能。
未來私域化的觀念,我認為只會日漸增強。
任何服務只要搭上羊毛出在羊身上的概念,要爬創作者的創作資料就要付錢給創作者,在未來都有機會吸引大量用戶。