← 返回
未分类 中文

Magyar Szövegfeldolgozás

Magyar nyelvű szövegek elemzése, összefoglalása, kulcsszó- és entitáskinyerése, valamint érzelem- és témaazonosítás magyar tartalmakhoz.
匈牙利语文本的解析、摘要、关键词与实体抽取、情感与主题识别。
izsook
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 435
下载
💾 3
安装
1
版本
#latest

概述

Magyar Szövegfeldolgozás

Áttekintés

Magyar nyelvű szövegek automatikus feldolgozása: elemzés, kivonatolás, összefoglalás, és kulcsszó kinyerés.

Mikor használd

  • Szöveg összefoglalás: hosszú magyar cikk tömörítése
  • Kulcsszó kinyerés: fontos szavak kigyűjtése magyar szövegből
  • Téma azonosítás: miről szól a magyar tartalom
  • Érzelem elemzés: pozitív/negatív hangulat magyar szövegben
  • Entitás kinyerés: nevek, helyek, dátumok magyar szövegben

Működés

1. Szöveg összefoglalás

def summarize_hungarian(text, max_sentences=3):
    # 1. Mondatokra bontás (magyar mondatvégi jelek: . ! ?)
    sentences = split_sentences(text)
    # 2. Fontossági súlyozás (kulcsszavak, pozíció)
    scored = score_sentences(sentences)
    # 3. Top N mondatok visszaadása
    return get_top_sentences(scored, max_sentences)

2. Kulcsszó kinyerés

def extract_keywords(text, top_n=5):
    # 1. Tokenizálás (magyar szóelemzés)
    tokens = tokenize(text)
    # 2. Stopwords szűrés (magyar stopword lista)
    filtered = remove_stopwords(tokens)
    # 3. Gyakoriság alapú rangsor
    return get_top_words(filtered, top_n)

3. Entitás kinyerés (NER)

  • Személyek: keresztnevek, vezetéknevek
  • Helyek: városok, országok, címek
  • Dátumok: magyar dátum formátumok (YYYY-MM-DD, "március 18")
  • Számok: pénzek, mennyiségek

Referenciák

  • references/szovegertes.md – magyar szövegértés best practices, kontextus megőrzés
  • references/stopwords.txt – magyar stopwords lista
  • references/magyar-regex.md – magyar szöveg regex minták
  • references/ner-patterns.md – entitás kinyerés minták

Scriptek

  • scripts/summarize.py – magyar szöveg összefoglalás
  • scripts/keywords.py – kulcsszó kinyerés
  • scripts/ner.py – entitás kinyerés

Szövegértés javítás

Lásd references/szovegertes.md:

  • Szólások, metaforák értelmezése
  • Többjelentésű szavak feloldása
  • Kontextus megőrzés több fordulós párbeszédben
  • Érzelem elemzés, téma azonosítás

Jegyzetek

  • Magyar agglutináló nyelv: szóvégi toldalékok kezelése fontos
  • Stopword lista kritikus a kulcsszó kinyeréshez
  • Helyi NLP modellek (pl. HunFlair) ha elérhetők

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 18:53 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

Biztonsági és Egészségvédelmi Terv

izsook
生成符合匈牙利法规的建筑项目安全健康计划(BET),含风险评估与规定。
★ 0 📥 414

Magyar Formázás

izsook
根据当地匈牙利规则格式化日期、数字、货币金额、电话号码和地址。
★ 0 📥 475

Magyar API Dokumentáció

izsook
搜索并解释匈牙利语的API文档、开发者指南、技术术语和示例代码。
★ 0 📥 449