基於Gemini處理150國新聞,谷歌開源洪水數據集Groundsource,覆蓋超260萬曆史記錄

谷歌開源洪水數據集Groundsource,覆蓋超260萬曆史記錄

核心內容摘要

谷歌研究團隊利用其大語言模型Gemini,對來自全球150多個國家的超過500萬篇新聞報道進行自動化處理,成功提取並整理出超過260萬條歷史洪水事件記錄,構建了名為Groundsource的洪水數據集。

技術實現與數據特點

  • 通過Gemini模型深度分析全球新聞報道,識別出橫跨150多個國家的洪水事件。
  • 數據集涵蓋超過260萬條歷史洪水事件,具備前所未有的規模與地理覆蓋範圍。
  • 每條事件均結合Google Maps進行精確定位,明確其地理邊界與位置信息。
  • 該數據集已開源,支持研究人員與開發者進行洪水建模與預測分析。

應用與未來展望

基於此數據集,谷歌已訓練出可提前24小時預測城市突發洪水的模型,有助於提升城市內澇預警能力,為災害預防與應急管理提供關鍵支持。

資料來源

36氪:谷歌開源洪水數據集Groundsource,覆蓋超260萬曆史記錄

來源:https://36kr.com/p/3727918044265606

返回頂端