SIST ISO 24614-2:2014

Oznaka standarda: SIST ISO 24614-2:2014
Koda projekta: 041666
Organizacija: SIST
Naslov (angleški): Language resource management - Word segmentation of written texts - Part 2: Word segmentation for Chinese, Japanese and Korean
Naslov (slovenski): Upravljanje z jezikovnimi viri - Besedna razčlenitev pisanega besedila - 2. del: Besedna razčlenitev za kitajski, japonski in korejski jezik
Če kupite standardizacijski dokument v .pdf formatu prek spletne prodaje, vam nudimo 20% popust pri spodnji ceni brez DDV. Cenik SIST
Dokumenti
Ime Jezik Status Cena Dodaj v košarico
SIST ISO 24614-2:2014 angleški jezik Active SIST-I: 71.00 EUR
PDF
Papir
Tehnični odbor: IDT - Informatika, dokumentacija in splošna terminologija
ICS: 01.140.10
Status: Objavljen
Objavljen: 01-sep-2014
Refer. št. objave: Sporocila 2014-09
Področje projekta (angleško): The basic concepts and general principles of word segmentation as defined in ISO 24614-1 apply to Chinese, Japanese and Korean. Text needs to be segmented into tokens, words, phrases or some other types of smaller textual units in order to perform certain computational applications on language resources, such as natural language processing, information retrieval (IR) and machine translation (MT). This part of ISO 24614 is restricted to the segmentation of a text into words or other word segmentation units (WSUs). This task is distinct from morphological or syntactic analysis per se, although it greatly depends on morphosyntactic analysis. It is also different from the task of laying out a framework for constructing a lexicon and identifying its lexical entries, namely lemmas and lexemes. The frameworks for the latter tasks are provided by ISO 24611, ISO 24613 and ISO 24615. The main objective of this part of ISO 24614 is to specify rules for delineating WSUs for Chinese, Japanese and Korean. Some rules are common to all three languages, though each language also has its own distinct rules for identifying WSUs. The common features are discussed in Clause 5, then the distinct rules are laid out in Clause 6 for Chinese, Clause 7 for Japanese and Clause 8 for Korean.
Področje projekta (slovensko): Osnovni pojmi in splošna načela besedne razčlenitve, kot je opredeljeno v standardu ISO 24614-1, veljajo za kitajski, japonski in korejski jezik. Besedilo mora biti razčlenjeno na znake, besede, fraze ali nekatere druge vrste manjših besedilnih enot za izvajanje nekaterih računalniških aplikacij za jezikovne vire, kot so jezikovna obdelava naravnega jezika, pridobivanje informacij (IR) in strojno prevajanje (MT). Ta del standarda ISO 24614 je omejen na razčlenitev besedila na besede ali druge besedne razčlenitvene enote (WSUs). Ta naloga se razlikuje od oblikoslovne in skladenjske analize, čeprav je v veliki meri odvisna od oblikoslovno-skladenjske analize. Prav tako se razlikuje od določanja okvirja za izgradnjo leksikona in določanje leksikalnih vnosov, in sicer lem in leksemov. Osnovo za ti dve nalogi ponujajo standardi ISO 24611, ISO 24613 in ISO 24615. Glavni cilj tega dela standarda ISO 24614 je določiti pravila za razmejevanje besednih razčlenitvenih enot za kitajski, japonski in korejski jezik. Nekatera pravila so skupna vsem trem jezikom, vendar ima vsak jezik tudi lastna pravila za določanje besednih razčlenitvenih enot. Skupne značilnosti so obravnavane v točki 5, posebna pravila pa so določena v točki 6 za kitajski jezik, točki 7 za japonski in točki 8 za korejski jezik.

Najbolje prodajani standardi