FINAL PROJECT · BIG DATA & AI ENGINEERING

台北房產
AI 決策系統

整合房屋市場大數據與機器學習模型,為買方與賣方提供客觀的價格參考依據。
精準預測、智慧推薦、洞察市場。

房屋資料筆數

32萬+

資料來源

4大平台

API 端點

3支

問題 → 解決方案 → 成果

⚠️

痛點

  • 房屋資訊碎片化,難以橫向比較
  • 技能需求與薪資透明度低
  • 缺乏客觀的價格量化工具
⚙️

解決方案

  • 統一爬取、ETL 清洗、資料入庫
  • LightGBM 分位數回歸模型
  • RESTful API + 互動前端

成果

  • 即時可互動的分析平台
  • AI 預測準確度 ±11-12%
  • 完整呈現市場結構與洞察

人員分工

L

Layla

專案經理

  • 永慶房屋現售價資料爬取及清洗
  • 捷運站經緯度資料清洗
  • 房價預測分析API製作
  • AI模型及API 優化
  • 互動式儀表製作
  • 甘特圖製作
  • UIUX首頁設計
F

Frances

工程師

  • 住商不動產現售價資料爬取及清洗
  • 資料庫上傳維護及備份
  • 模型/API 初版
  • API 優化
  • 專題簡報製作
K

Kevin

工程師

  • 信義房屋現售價資料爬取及清洗
  • 實價登錄成交價資料爬取及清洗
  • 資料庫架構設計
  • 市場預測分析API製作
  • API 網頁架構整合
B

Betty

工程師

  • 實價登錄成交價爬取
  • 市場預測分析API製作

資料來源

🏢

永慶房屋

🏢

信義房屋

🏢

住商不動產

📊

政府實價登錄

核心功能

精準房價預估

利用 LightGBM 分位數回歸模型,提供低、中、高三個分位數價格預測

購屋預算推薦

根據使用者需求與市場行情,推薦合理的購屋預算區間

市場漲幅分析

分析台北市房價趨勢與地段溢價,掌握市場動態

AI 模型說明

模型成效評估

實價登錄 P50 模型

12.12%

預測單價平均誤差

房屋現售 P50 模型

11.30%

預測單價平均誤差

特徵工程

  • 捷運生活圈:利用 cKDTree 演算法進行空間檢索,將房地產資料自動歸屬至最近的捷運站點
  • 座標交互項:捕捉地理座標的非線性交互作用,識別特定地段(如蛋黃區)的加乘效應
  • 樓層比:使用樓層比而非絕對樓層,更精準反映住宅價值
  • 時間數值化:統一將時間轉換為以「月」為單位的線性數值

技術限制

  • 模型無法捕捉裝潢品質、朝向、視野、鄰近設施等隱性因素
  • 預測結果對罕見地段(訓練資料少的地區)準確度較低
  • 座標交互項為線性近似,複雜地段梯度可能存在誤差
  • 時間特徵僅捕捉線性趨勢,無法預測市場急遽波動