GitHub 假星產業鏈曝光:CMU 團隊發現 600 萬顆假星,AI 項目成重災區
研究發現 GitHub 存在大規模假星現象
卡內基梅隆大學(CMU)研究團隊研發出可檢測異常 Star 行為的工具 StarScout,透過識別殭屍帳號、同步批量點星等異常模式,精準定位 GitHub 上的虛假標星。研究顯示,GitHub 上存在約 600 萬顆假 Star,涉及 18,617 個倉庫(repo)與 30 萬個參與帳號。
假星交易明碼標價,AI 項目受害最深
假星已形成一條完整的產業鏈,價格約為 5 毛人民幣/顆。許多創投(VC)機構發現,僅需花費 200 美元即可買到足以達到種子輪門檻的人氣。在此背景下,AI 與大語言模型(LLM)項目成為造假的重災區,許多虛假項目透過刷星來吸引投資與關注。
虛假項目的典型特徵
根據相關數據分析,虛假 GitHub 項目通常具備以下四種特徵:
- 滑溜的 README:內容看似專業但缺乏實質技術細節。
- 靜默的提交記錄:長期沒有真實的開發者提交代碼。
- 機器人產生的 Issue:問題與回答多由自動化腳本生成。
- 無歷史作者:倉庫缺乏真實開發者的長期維護痕跡。
行業影響與未來挑戰
此現象不僅影響投資人的判斷,也對真正優秀的開源項目造成不公平競爭。隨著檢測工具的普及,未來 GitHub 平臺可能需要更嚴格的機制來驗證標星的真實性,以維護生態系統的誠信。
