← 返回
数据分析 中文

Housesigma Collector

HouseSigma 매물 데이터를 자동 및 수동으로 수집해 Hauscout SQLite DB에 저장하고 크론잡으로 주기적 업데이트를 지원합니다.
自动或手动采集 HouseSigma 房源数据,存入 Hauscout SQLite 数据库,并通过定时任务支持周期性更新。
sonim1
数据分析 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 686
下载
💾 14
安装
1
版本
#latest

概述

HouseSigma Collector Skill

HouseSigma에서 매물 데이터를 수집하여 Hauscout SQLite DB에 저장하는 skill.

프로젝트 경로

  • Hauscout: /Users/kendrick/projects/hauscout
  • DB: /Users/kendrick/projects/hauscout/data/hauscout.db
  • 스크립트: /Users/kendrick/projects/hauscout/scripts/collect.ts

사용법

자동 수집 (검색 프로필 기반)

cd /Users/kendrick/projects/hauscout && npx tsx scripts/collect.ts

특정 매물 수집

cd /Users/kendrick/projects/hauscout && npx tsx scripts/collect.ts --url "<housesigma_url>"

특정 프로필만 수집

cd /Users/kendrick/projects/hauscout && npx tsx scripts/collect.ts --profile <id>

브라우저 창 보면서 수집 (디버깅)

cd /Users/kendrick/projects/hauscout && npx tsx scripts/collect.ts --headed

수동 수집 (브라우저 직접 사용)

Playwright 스크립트 대신 Clawdbot 브라우저로 직접 수집할 때:

  1. 브라우저로 HouseSigma 매물 상세 페이지 열기
  2. DOM 스냅샷에서 데이터 추출
  3. SQLite에 직접 INSERT

DOM 데이터 매핑

HouseSigma 상세 페이지의 구조:

  • 주소/상태:

    태그 (Unit X - Street - Municipality - Community)

  • 가격: 태그의 $ X,XXX 패턴
  • Key Facts:
    /
    쌍 (Tax, Property Type, Maintenance, etc.)
  • Details: 같은
    /
    패턴 (Bedrooms, Bathrooms, etc.)
  • 방 정보: "Metres" 섹션의 텍스트 패턴
  • Estimates: SigmaEstimate, Estimated Rent, Rental Yield
  • 학교: Catchment Schools 섹션
  • 인기도: "Popularity : XX/100" 텍스트
  • 커뮤니티 통계: Community Statistics 섹션

검색 프로필 관리

프로필 추가:

cd /Users/kendrick/projects/hauscout
sqlite3 data/hauscout.db "INSERT INTO search_profiles (name, center_lat, center_lng, radius_km, property_types, price_min, price_max, beds_min, beds_max, baths_min, baths_max, is_active) VALUES ('이름', lat, lng, radius, '[\"Condo Apartment\"]', 0, 800000, 2, 3, 1, 2, 1);"

현재 프로필 확인:

sqlite3 data/hauscout.db "SELECT * FROM search_profiles;"

데이터 수집 후

수집 후 대시보드에 반영하려면:

cd /Users/kendrick/projects/hauscout
git add data/hauscout.db
git commit -m "data: daily collection $(date +%Y-%m-%d)"
git push

Vercel 배포 시 자동으로 최신 데이터가 반영됩니다.

크론잡

Clawdbot cron으로 매일 오전 9시에 자동 수집:

  • 스크립트 실행 → DB 업데이트 → git commit & push

주의사항

  • HouseSigma rate limiting 방지를 위해 요청 간 2-4초 간격 유지
  • headless 모드에서 차단될 수 있음 → --headed 옵션으로 확인
  • 검색 프로필의 결과가 많으면 시간이 오래 걸림 (매물당 ~5초)

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 11:54 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Preqstation

sonim1
{"answer":"将PREQSTATION编码任务委派给Claude Code、Codex CLI或Gemini CLI,采用PTY安全执行(工作目录+后台+监控)。用于构建、重..."}
★ 0 📥 1,205
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 198 📥 64,862
data-analysis

Excel / XLSX

ivangdavila
创建、检查和编辑 Microsoft Excel 工作簿及 XLSX 文件,支持可靠的公式、日期、类型、格式、重算及模板保留功能。
★ 366 📥 139,970