FINAL PROJECT · BIG DATA & AI ENGINEERING
台北房產
AI 決策系統
整合房屋市場大數據與機器學習模型,為買方與賣方提供客觀的價格參考依據。
精準預測、智慧推薦、洞察市場。
房屋資料筆數
32萬+
資料來源
4大平台
API 端點
3支
問題 → 解決方案 → 成果
痛點
- 房屋資訊碎片化,難以橫向比較
- 技能需求與薪資透明度低
- 缺乏客觀的價格量化工具
解決方案
- 統一爬取、ETL 清洗、資料入庫
- LightGBM 分位數回歸模型
- RESTful API + 互動前端
成果
- 即時可互動的分析平台
- AI 預測準確度 ±11-12%
- 完整呈現市場結構與洞察
人員分工
L
Layla
專案經理
- 永慶房屋現售價資料爬取及清洗
- 捷運站經緯度資料清洗
- 房價預測分析API製作
- AI模型及API 優化
- 互動式儀表製作
- 甘特圖製作
- UIUX首頁設計
F
Frances
工程師
- 住商不動產現售價資料爬取及清洗
- 資料庫上傳維護及備份
- 模型/API 初版
- API 優化
- 專題簡報製作
K
Kevin
工程師
- 信義房屋現售價資料爬取及清洗
- 實價登錄成交價資料爬取及清洗
- 資料庫架構設計
- 市場預測分析API製作
- API 網頁架構整合
B
Betty
工程師
- 實價登錄成交價爬取
- 市場預測分析API製作
資料來源
永慶房屋
信義房屋
住商不動產
政府實價登錄
核心功能
精準房價預估
利用 LightGBM 分位數回歸模型,提供低、中、高三個分位數價格預測
購屋預算推薦
根據使用者需求與市場行情,推薦合理的購屋預算區間
市場漲幅分析
分析台北市房價趨勢與地段溢價,掌握市場動態
AI 模型說明
模型成效評估
實價登錄 P50 模型
12.12%
預測單價平均誤差
房屋現售 P50 模型
11.30%
預測單價平均誤差
特徵工程
- 捷運生活圈:利用 cKDTree 演算法進行空間檢索,將房地產資料自動歸屬至最近的捷運站點
- 座標交互項:捕捉地理座標的非線性交互作用,識別特定地段(如蛋黃區)的加乘效應
- 樓層比:使用樓層比而非絕對樓層,更精準反映住宅價值
- 時間數值化:統一將時間轉換為以「月」為單位的線性數值
技術限制
- 模型無法捕捉裝潢品質、朝向、視野、鄰近設施等隱性因素
- 預測結果對罕見地段(訓練資料少的地區)準確度較低
- 座標交互項為線性近似,複雜地段梯度可能存在誤差
- 時間特徵僅捕捉線性趨勢,無法預測市場急遽波動