Codes for the representation of names of languages - Part 4: General principles of coding of the representation of names of languages and related entities, and application guidelines

This part of ISO 639 gives the general principles of language coding using the codes that are specified in the other parts of ISO 639 and their combination with other codes. Furthermore, this part of ISO 639 lays down guidelines for the use of any combination of the parts of ISO 639. The terminology and general descriptions of this part of ISO 639 are intended to replace corresponding text of other parts of ISO 639 as relevant in future revisions. Relevant metadata for the description of linguistic entities are also given, as a framework for databases of linguistic data to support the ISO 639 series of International Standards.

Codes pour la représentation des noms de langue - Partie 4: Principes généraux pour le codage de la représentation des noms de langue et d'entités connexes, et lignes directrices pour la mise en oeuvre

L'ISO 639-4:2010 fournit les principes g�n�raux de codage des langues � l'aide des codes sp�cifi�s dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d'autres codes. De plus, elle �tablit des r�gles d'utilisation de n'importe quelle combinaison des parties de l'ISO 639.
La terminologie et les descriptions g�n�rales de l'ISO 639-4:2010 sont destin�es � remplacer le texte correspondant des autres parties de l'ISO 639, selon le cas, dans de futures r�visions.
Les m�tadonn�es pertinentes pour la description des entit�s linguistiques sont �galement fournies et servent de cadre de travail pour les bases de donn�es linguistiques qui accompagnent la s�rie de Normes internationales ISO 639.

Kode za predstavljanje imen jezikov - 4. del: Splošna načela kodiranja predstavitve imen jezikov in sorodnih entitet ter smernice za uporabo

Ta del ISO 639 podaja splošna načela kodiranja jezikov z uporabo kod, ki so določene v drugih delih ISO 639, ter njihovih kombinacij z drugimi kodami. Poleg tega ta del ISO 639 določa smernice za uporabo katere koli kombinacije delov ISO 639. Terminologija in splošni opisi tega dela ISO 639 so namenjeni temu, da primerno nadomestijo ustrezno besedilo drugih delov ISO 639 za prihodnje revizije. Prav tako so podani pomembni metapodatki za opis lingvističnih entitet kot okvir za podatkovne zbirke lingvističnih podatkov v podporo seriji mednarodnih standardov ISO 639.

General Information

Status
Published In Translation
Public Enquiry End Date
31-Dec-2008
Publication Date
10-Oct-2010
Current Stage
6100 - Translation of adopted SIST standards (Adopted Project)
Start Date
24-Oct-2013
Due Date
23-Oct-2014

Relations

Buy Standard

Standard
ISO 639-4:2010 - Codes for the representation of names of languages
English language
28 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 639-4:2010
English language
33 pages
sale 10% off
Preview
sale 10% off
Preview
e-Library read for
1 day
Standard
ISO 639-4:2010 - Codes pour la représentation des noms de langue
French language
28 pages
sale 15% off
Preview
sale 15% off
Preview
Standard
ISO 639-4:2010 - Codes pour la représentation des noms de langue
French language
28 pages
sale 15% off
Preview
sale 15% off
Preview

Standards Content (Sample)

INTERNATIONAL ISO
STANDARD 639-4
First edition
2010-07-15

Codes for the representation of names of
languages —
Part 4:
General principles of coding of the
representation of names of languages
and related entities, and application
guidelines
Codes pour la représentation des noms de langue —
Partie 4: Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour la mise
en œuvre




Reference number
ISO 639-4:2010(E)
©
ISO 2010

---------------------- Page: 1 ----------------------
ISO 639-4:2010(E)
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but
shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation
parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In
the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.


COPYRIGHT PROTECTED DOCUMENT


©  ISO 2010
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland

ii © ISO 2010 – All rights reserved

---------------------- Page: 2 ----------------------
ISO 639-4:2010(E)
Contents Page
Foreword .iv
Introduction.v
1 Scope.1
2 Normative references.1
3 Terms and definitions .2
4 Fundamental concepts of language coding .5
4.1 Language identifiers and languages.5
4.2 Individual languages .6
4.3 Macrolanguages .6
4.4 Linguistic norm.7
4.5 Dialects.7
4.6 Collective language code elements and language groups.7
4.7 Extinct, ancient and historic languages.8
4.8 Artificial languages .8
4.9 Writing systems and scripts.8
5 Relationship between the parts of ISO 639.8
5.1 Parts of ISO 639 .8
5.2 ISO 639 as one code space .8
5.3 Principles.9
5.4 Common maintenance and language coding database .9
6 Implementation issues.9
6.1 Applications .9
6.2 Subsets of the code table.10
6.3 Language groups .10
7 Combining language identifiers with other standards and codes .11
7.1 Combining ISO 639 with ISO 3166 .11
7.2 Combining ISO 639 with ISO 19111 and ISO 19112 .11
7.3 Combining ISO 639 with ISO 15924 .12
7.4 Other code combinations .12
7.5 Formats of combined identifiers.12
8 Language description format (LDF) .13
8.1 Compatibilities between the ISO 639 model and ISO 12620 .13
8.1.1 General .13
8.1.2 Identification .15
8.1.3 Description of an ISO 639 language identifier.16
8.2 Extensions to ISO 12620 for ISO 639 LDF.20
8.2.1 Representation .20
8.2.2 Documentation .21
8.3 Language information.23
Annex A (informative) Overall steering of ISO 639.26
Bibliography.28

© ISO 2010 – All rights reserved iii

---------------------- Page: 3 ----------------------
ISO 639-4:2010(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 639-4 was prepared by Technical Committee ISO/TC 37, Terminology and other language and content
resources, Subcommittee SC 2, Terminographical and lexicographical working methods.
ISO 639 consists of the following parts, under the general title Codes for the representation of names of
languages:
⎯ Part 1: Alpha-2 code
⎯ Part 2: Alpha-3 code
⎯ Part 3: Alpha-3 code for comprehensive coverage of languages
⎯ Part 4: General principles of coding of the representation of names of languages and related entities, and
application guidelines
⎯ Part 5: Alpha-3 code for language families and groups
⎯ Part 6: Alpha-4 code for comprehensive coverage of language variants

iv © ISO 2010 – All rights reserved

---------------------- Page: 4 ----------------------
ISO 639-4:2010(E)
Introduction
ISO 639 provides codes for the identification and specification of individual languages, language variants, and
language groups. The identifiers may be used in a variety of applications, including specification of the
language used in a text, the language of terms or words in a dictionary or terminological database, the
language used in a spoken presentation, language proficiency, language capabilities of software, localization,
etc. The various parts of ISO 639 are expected to be implemented in a number of environments.
Parts 1, 2, 3, and 5 of ISO 639 all contain some information about implementation issues. However, it is
deemed necessary to expand those descriptions, and to have the implementation rules in a separate
document. In future revisions of the other parts of ISO 639, it is expected that those standards will reference
this part of ISO 639 rather than duplicating the information.

© ISO 2010 – All rights reserved v

---------------------- Page: 5 ----------------------
INTERNATIONAL STANDARD ISO 639-4:2010(E)

Codes for the representation of names of languages —
Part 4:
General principles of coding of the representation of names of
languages and related entities, and application guidelines
1 Scope
This part of ISO 639 gives the general principles of language coding using the codes that are specified in the
other parts of ISO 639 and their combination with other codes. Furthermore, this part of ISO 639 lays down
guidelines for the use of any combination of the parts of ISO 639.
The terminology and general descriptions of this part of ISO 639 are intended to replace corresponding text of
other parts of ISO 639 as relevant in future revisions.
Relevant metadata for the description of linguistic entities are also given, as a framework for databases of
linguistic data to support the ISO 639 series of International Standards.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced
document (including any amendments) applies.
ISO 639-1:2002, Codes for the representation of names of languages — Part 1: Alpha-2 code
ISO 639-2:1998, Codes for the representation of names of languages — Part 2: Alpha-3 code
ISO 639-3:2007, Codes for the representation of names of languages — Part 3: Alpha-3 code for
comprehensive coverage of languages
ISO 639-5:2008, Codes for the representation of names of languages — Part 5: Alpha-3 code for language
families and groups
ISO 3166-1:2006, Codes for the representation of names of countries and their subdivisions — Part 1:
Country codes
ISO 3166-2:2007, Codes for the representation of names of countries and their subdivisions — Part 2:
Country subdivision code
ISO 3166-3:1999, Codes for the representation of names of countries and their subdivisions — Part 3: Code
for formerly used names of countries
ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of
dates and times
ISO/IEC 11179-1:2004, Information technology — Metadata registries (MDR) — Part 1: Framework
© ISO 2010 – All rights reserved 1

---------------------- Page: 6 ----------------------
ISO 639-4:2010(E)
ISO/IEC 11179-2:2005, Information technology — Metadata registries (MDR) — Part 2: Classification
ISO/IEC 11179-3:2003, Information technology — Metadata registries (MDR) — Part 3: Registry metamodel
and basic attributes
ISO/IEC 11179-4:2004, Information technology — Metadata registries (MDR) — Part 4: Formulation of data
definitions
ISO/IEC 11179-5:2005, Information technology — Metadata registries (MDR) — Part 5: Naming and
identification principles
ISO/IEC 11179-6:2005, Information technology — Metadata registries (MDR) — Part 6: Registration
ISO 12620:2009, Terminology and other language and content resources — Specification of data categories
and management of a Data Category Registry for language resources
ISO 15924:2004, Information and documentation — Codes for the representation of names of scripts
ISO 19111:2007, Geographic information — Spatial referencing by coordinates
ISO 19112:2003, Geographic information — Spatial referencing by geographic identifiers
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
In future versions of other parts of ISO 639, it is expected that some or all of the terms and definitions will be
replaced by a reference to the terms and definitions in this part of ISO 639.
NOTE The definitions in this part of ISO 639 are intended for practical use within the context of the various parts of
ISO 639 and their applications. For various linguistic purposes, there are needs for more detailed, and possibly deviating,
definitions.
3.1
code
data transformed or represented in different forms according to a pre-established set of rules
NOTE The usage of the term “code” is not uniform in all standardized coding systems. According to the usage that is
defined in this part of ISO 639, a “code” is to be understood as a code table (3.2) and the set of rules relating to the code
table. Each individual row in a code table is a code element (3.4) (e.g. “de - German - allemand - Deutsch” in Part 1 of
ISO 639), while the item “de” is the language identifier (3.5).
3.2
code table
table of code elements (3.4) as part of a code (3.1)
3.3
code space
totality of possible values for a set of identifiers within a code (3.1)
EXAMPLE All sequences of two letters (a–z) form the code space of the alpha-2 language code as specified in
part 1 of ISO 639.
NOTE The alpha-3 language codes that are specified in parts 2, 3, and 5 of ISO 639 share the same code space, i.e.
no language identifier assigned in one of the parts may be assigned to a different item in another part.
2 © ISO 2010 – All rights reserved

---------------------- Page: 7 ----------------------
ISO 639-4:2010(E)
3.4
code element
individual entry in a code (3.1)
NOTE In the language codes of ISO 639, each code element consists of a language identifier and the names of the
language.
3.5
language identifier
language symbol
string of characters assigned to a linguistic entity for the purpose of uniquely representing it
NOTE 1 In the language codes of Parts 1, 2, 3, and 5 of ISO 639, each language identifier is composed of two or three
letters.
NOTE 2 See 4.1.
3.6
language
systematic use of sounds, characters, symbols or signs to express or communicate meaning or a message
between humans
NOTE 1 This definition is intended to serve as a working definition for the purpose of the ISO 639 series of
International Standards, not as a universal definition of this concept.
NOTE 2 See also 4.1 and 4.2.
3.7
individual language
language (3.6) that is distinctly different from another language
NOTE See 4.2.
3.8
dialect
language variant (3.14) specific to a geographical region or a group of language users
NOTE See 4.5.
3.9
macrolanguage
language (3.6) that for some purpose may be subdivided into two or more individual languages (3.7)
NOTE See 4.3.
3.10
language group
two or more individual languages (3.7) that for a specific purpose may suitably be treated as a unit
NOTE See 4.6.
3.11
language family
two or more individual languages (3.7) that are related to each other through having common ancestry
NOTE In exceptional cases, a language family may have only one individual language as a member.
© ISO 2010 – All rights reserved 3

---------------------- Page: 8 ----------------------
ISO 639-4:2010(E)
3.12
remainder group
language group (3.10) with the explicit exclusion of specified languages
NOTE See 4.6.
3.13
language variation
continuous variation within and between individual languages (3.7)
NOTE Language variation is seen and may be described as variation over time, space, cultural affiliation, etc.
3.14
language variant
variant of an individual language (3.7) that may be identified and named
3.15
standard variant
language variant (3.14) with a high degree of status and normalization
NOTE A standard variant of a language may typically be used in official or public communication and in
communication between users of different language variants.
3.16
writing system
system for writing a language (3.6), including the script (3.17) and character set used
NOTE See also 4.9.
3.17
script
set of graphic characters used for the written form of one or more languages (3.6)
[ISO 15924:2004 and ISO/IEC 10646:2003]
NOTE See also 4.9.
3.18
orthography
set of rules for accepted spelling of words and text in one or more languages (3.6)
3.19
transcription
system for representing text in a different script (3.17) than that in which the text was originally represented
NOTE The resulting text is also referred to as a “transcription”.
3.20
transliteration
transcription (3.19) that enables the reconstruction of the original script (3.17) without any loss of
information about graphic characters
NOTE The resulting text is also referred to as a “transliteration”.
3.21
written language
individual language (3.7) or language variant (3.14) that is commonly represented in writing with a relatively
normalized orthography (3.18)
4 © ISO 2010 – All rights reserved

---------------------- Page: 9 ----------------------
ISO 639-4:2010(E)
3.22
spoken language
individual language (3.7) or language variant (3.14) that is represented in spoken form
NOTE Any spoken language may be represented in writing using a phonetic writing system, where characters
represent sounds (phones or phonemes) directly.
3.23
living language
individual language (3.7) or language variant (3.14) in present-day use, in particular as a spoken
language (3.22)
3.24
extinct language
individual language (3.7) or language variant (3.14) that is no longer in use and that has no present-day
descendant
NOTE See 4.7.
3.25
ancient language
extinct language (3.24) with a distinct literature and special status in the scholarly community
NOTE See 4.7.
3.26
historical language
known earlier historical stage of a living language (3.23) or an extinct language (3.24)
EXAMPLE “Old English” and “Middle English” as historical stages of “English”.
NOTE See 4.7.
3.27
natural language
language (3.6) for human communication that is not an artificial language (3.28)
3.28
artificial language
language (3.6) for human communication that has been artificially devised
NOTE See also 4.8.
4 Fundamental concepts of language coding
4.1 Language identifiers and languages
Language identifiers are composed of the following 26 letters of the Latin alphabet in lower case: a, b, c, d, e, f,
g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. No diacritical marks or modified characters are used.
A language identifier represents a language, which may also be represented by one or more language names.
The objects of identification are languages themselves; language names are the means by which the
languages denoted by language identifiers are designated.
Languages are not static objects every instantiation of which is identical to every other. Every language
corresponds to some range of variation in linguistic expression. In ISO 639, a language identifier denotes
some range of language variation. The range of variation that is denoted can have three different scopes:
individual language, macrolanguage or language group. Also, languages that are represented can be of
© ISO 2010 – All rights reserved 5

---------------------- Page: 10 ----------------------
ISO 639-4:2010(E)
various types: living languages, ancient languages, artificially constructed languages, etc. The following
provides further explanation regarding assignment of identifiers for different scopes or to different types of
languages in ISO 639.
4.2 Individual languages
Identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to denote distinct individual languages, unless the
language name explicitly refers to a language group.
There is no one definition of a “language” that is agreed upon by all and appropriate for all purposes. As a
result, there can be disagreement, even among speakers of the language or experts in linguistics, as to
whether two variants represent dialects of a single language or two distinct languages. For ISO 639,
judgments regarding when two variants are considered to be the same or different languages are based on a
number of factors, including linguistic similarity, intelligibility, a common literature, the views of speakers
concerning the relationship between language and identity, and other factors. The following basic criteria are
followed.
⎯ Two related variants are normally considered variants of the same language if speakers of each variant
have inherent understanding of the other variant (that is, can understand based on knowledge of their
own variant without needing to learn the other variant) at a functional level.
⎯ Where spoken intelligibility between variants is marginal, the existence of a common literature or of a
common ethnolinguistic identity with a central variant that both understand can be strong indicators that
they should nevertheless be considered variants of the same language.
⎯ Where there is enough intelligibility between variants to enable communication, the existence of well-
established distinct ethnolinguistic identities can be a strong indicator that they should nevertheless be
considered to be different languages.
Some of the distinctions made on this basis may not be considered appropriate by some users or for certain
applications. However, these basic criteria are thought to best fit the intended range of applications.
4.3 Macrolanguages
Parts 1 and 2 of ISO 639 include identifiers that correspond in a one-to-many manner with individual language
identifiers in Part 3 of ISO 639. For instance, Part 3 of ISO 639 contains over 30 identifiers designated as
individual language identifiers for distinct variants of Arabic, while Parts 1 and 2 each contain only one
identifier for Arabic, “ar” and “ara” respectively, which are designated as individual language identifiers in
those parts of ISO 639. It is assumed here that the single identifiers for Arabic in Parts 1 and 2 of ISO 639
correspond to the many identifiers collectively for distinct variants of Arabic in Part 3 of ISO 639.
In this example, it may appear that the single identifiers in Parts 1 and 2 of ISO 639 should be designated as
collective language identifiers. That is not assumed, however. In various parts of the world, there are clusters
of closely-related language variants that, based on the criteria discussed in 4.2, can be considered individual
languages, yet in certain usage contexts a single language identity for all is needed. Typical situations in
which this need can occur include the following.
⎯ There is one variant that is more developed and that tends to be used for wider communication by
speakers of various closely-related languages; as a result, there is a perceived common linguistic identity
across these languages. For instance, there are several distinct spoken Arabic languages, but Standard
Arabic is generally used in business and media across all of these communities, and is also an important
aspect of a shared ethno-religious unity. As a result, a perceived common linguistic identity exists.
⎯ There is a common written form used for multiple closely-related languages. For instance, multiple
Chinese languages share a common written form.
6 © ISO 2010 – All rights reserved

---------------------- Page: 11 ----------------------
ISO 639-4:2010(E)
⎯ There is a transitional sociolinguistic situation in which sub-communities of a single language community
are diverging, creating a need for some purposes to recognise distinct languages while, for other
purposes, a single common identity is still valid. For instance, in some business contexts it is necessary
to make a distinction between the languages Bosnian, Croatian, and Serbian; yet there are other contexts
in which these distinctions are not discernable in language resources that are in use.
Where such situations exist, an identifier for the single, common language identity is considered to be a
macrolanguage identifier.
Macrolanguages are distinguished from language groups in that the individual languages that correspond to a
macrolanguage must be very closely related, and there must be some domain in which only a single language
identity is recognized.
4.4 Linguistic norm
Some linguistic forms are “normalized” or “standardized” by official or private bodies like academies or
language councils. This normalization may be applied to any elements: orthography, morphology, syntax,
semantics, phonology, etc. The degree of normalization varies greatly from one language to another.
Languages or forms of languages may be considered to have some sort of official status within countries or
regions. Language status may be established through acts of parliament or through other formal procedures,
giving a language status as “national language”, “official language”, “regional language”, etc.
4.5 Dialects
The linguistic variants denoted by each of the identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to be
distinct languages and not dialects of other languages, even though for some purposes some users may
consider a variant listed in Part 1 or 2, or in particular Part 3 of ISO 639 to be a “dialect” rather than a
“language” (see 4.2 and 4.3). In ISO 639, the term dialect is used as in the field of linguistics where it identifies
any sub-variant of a language such as might be based on geographic region, age, gender, social class, time
period, etc.
The dialects of a language are included within the denotation represented by the identifier for that language.
Thus, each language identifier represents the complete range of all the spoken or written variants of that
language, including any standardized form.
For applications in which it is necessary to identify dialects, a separate standard may be developed that
provides identifiers for dialects, or that combines identifiers from ISO 639 with other distinguishing
identificational qualifiers.
4.6 Collective language code elements and language groups
Part 2 of ISO 639 includes alpha-3 identifiers for collections of languages, and Part 5 is especially dedicated
to language groups and language families. Parts 1 and 3 provide identifiers for individual languages and
macrolanguages only.
Some of the code elements in Part 2 specify remainder groups. These items have the word “other” in their
English names (and “autres” in their French names). The same alpha-3 identifiers are included in Part 5 of
ISO 639 denoting the language group or family as a whole. For applications using Part 2 only, the remainder
group identifiers shall be used for languages that belong to the language group or family in question, but that
do not have an individual-language identifier in Part 2. Applications using Parts 2 and 5 and applications using
Parts 2 and 3 and 5 shall use the collective language code elements in the sense specified in Part 5, allowing
for hierarchies of language identifiers.
© ISO 2010 – All rights reserved 7

---------------------- Page: 12 ----------------------
ISO 639-4:2010(E)
4.7 Extinct, ancient and historic languages
ISO 639 includes
...

SLOVENSKI STANDARD
SIST ISO 639-4:2010
01-november-2010
.RGH]DSUHGVWDYOMDQMHLPHQMH]LNRYGHO6SORãQDQDþHODNRGLUDQMDSUHGVWDYLWYH
LPHQMH]LNRYLQVRURGQLKHQWLWHWWHUVPHUQLFH]DXSRUDER
Codes for the representation of names of languages - Part 4: General principles of
coding of the representation of names of languages and related entities, and application
guidelines
Codes pour la représentation des noms de langue - Partie 4: Principes généraux pour le
codage de la représentation des noms de langue et d'entités connexes, et lignes
directrices pour la mise en oeuvre
Ta slovenski standard je istoveten z: ISO 639-4:2010
ICS:
01.140.20 Informacijske vede Information sciences
SIST ISO 639-4:2010 en,fr
2003-01.Slovenski inštitut za standardizacijo. Razmnoževanje celote ali delov tega standarda ni dovoljeno.

---------------------- Page: 1 ----------------------

SIST ISO 639-4:2010

---------------------- Page: 2 ----------------------

SIST ISO 639-4:2010

INTERNATIONAL ISO
STANDARD 639-4
First edition
2010-07-15

Codes for the representation of names of
languages —
Part 4:
General principles of coding of the
representation of names of languages
and related entities, and application
guidelines
Codes pour la représentation des noms de langue —
Partie 4: Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour la mise
en œuvre




Reference number
ISO 639-4:2010(E)
©
ISO 2010

---------------------- Page: 3 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
PDF disclaimer
This PDF file may contain embedded typefaces. In accordance with Adobe's licensing policy, this file may be printed or viewed but
shall not be edited unless the typefaces which are embedded are licensed to and installed on the computer performing the editing. In
downloading this file, parties accept therein the responsibility of not infringing Adobe's licensing policy. The ISO Central Secretariat
accepts no liability in this area.
Adobe is a trademark of Adobe Systems Incorporated.
Details of the software products used to create this PDF file can be found in the General Info relative to the file; the PDF-creation
parameters were optimized for printing. Every care has been taken to ensure that the file is suitable for use by ISO member bodies. In
the unlikely event that a problem relating to it is found, please inform the Central Secretariat at the address given below.


COPYRIGHT PROTECTED DOCUMENT


©  ISO 2010
All rights reserved. Unless otherwise specified, no part of this publication may be reproduced or utilized in any form or by any means,
electronic or mechanical, including photocopying and microfilm, without permission in writing from either ISO at the address below or
ISO's member body in the country of the requester.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Published in Switzerland

ii © ISO 2010 – All rights reserved

---------------------- Page: 4 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
Contents Page
Foreword .iv
Introduction.v
1 Scope.1
2 Normative references.1
3 Terms and definitions .2
4 Fundamental concepts of language coding .5
4.1 Language identifiers and languages.5
4.2 Individual languages .6
4.3 Macrolanguages .6
4.4 Linguistic norm.7
4.5 Dialects.7
4.6 Collective language code elements and language groups.7
4.7 Extinct, ancient and historic languages.8
4.8 Artificial languages .8
4.9 Writing systems and scripts.8
5 Relationship between the parts of ISO 639.8
5.1 Parts of ISO 639 .8
5.2 ISO 639 as one code space .8
5.3 Principles.9
5.4 Common maintenance and language coding database .9
6 Implementation issues.9
6.1 Applications .9
6.2 Subsets of the code table.10
6.3 Language groups .10
7 Combining language identifiers with other standards and codes .11
7.1 Combining ISO 639 with ISO 3166 .11
7.2 Combining ISO 639 with ISO 19111 and ISO 19112 .11
7.3 Combining ISO 639 with ISO 15924 .12
7.4 Other code combinations .12
7.5 Formats of combined identifiers.12
8 Language description format (LDF) .13
8.1 Compatibilities between the ISO 639 model and ISO 12620 .13
8.1.1 General .13
8.1.2 Identification .15
8.1.3 Description of an ISO 639 language identifier.16
8.2 Extensions to ISO 12620 for ISO 639 LDF.20
8.2.1 Representation .20
8.2.2 Documentation .21
8.3 Language information.23
Annex A (informative) Overall steering of ISO 639.26
Bibliography.28

© ISO 2010 – All rights reserved iii

---------------------- Page: 5 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
Foreword
ISO (the International Organization for Standardization) is a worldwide federation of national standards bodies
(ISO member bodies). The work of preparing International Standards is normally carried out through ISO
technical committees. Each member body interested in a subject for which a technical committee has been
established has the right to be represented on that committee. International organizations, governmental and
non-governmental, in liaison with ISO, also take part in the work. ISO collaborates closely with the
International Electrotechnical Commission (IEC) on all matters of electrotechnical standardization.
International Standards are drafted in accordance with the rules given in the ISO/IEC Directives, Part 2.
The main task of technical committees is to prepare International Standards. Draft International Standards
adopted by the technical committees are circulated to the member bodies for voting. Publication as an
International Standard requires approval by at least 75 % of the member bodies casting a vote.
Attention is drawn to the possibility that some of the elements of this document may be the subject of patent
rights. ISO shall not be held responsible for identifying any or all such patent rights.
ISO 639-4 was prepared by Technical Committee ISO/TC 37, Terminology and other language and content
resources, Subcommittee SC 2, Terminographical and lexicographical working methods.
ISO 639 consists of the following parts, under the general title Codes for the representation of names of
languages:
⎯ Part 1: Alpha-2 code
⎯ Part 2: Alpha-3 code
⎯ Part 3: Alpha-3 code for comprehensive coverage of languages
⎯ Part 4: General principles of coding of the representation of names of languages and related entities, and
application guidelines
⎯ Part 5: Alpha-3 code for language families and groups
⎯ Part 6: Alpha-4 code for comprehensive coverage of language variants

iv © ISO 2010 – All rights reserved

---------------------- Page: 6 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
Introduction
ISO 639 provides codes for the identification and specification of individual languages, language variants, and
language groups. The identifiers may be used in a variety of applications, including specification of the
language used in a text, the language of terms or words in a dictionary or terminological database, the
language used in a spoken presentation, language proficiency, language capabilities of software, localization,
etc. The various parts of ISO 639 are expected to be implemented in a number of environments.
Parts 1, 2, 3, and 5 of ISO 639 all contain some information about implementation issues. However, it is
deemed necessary to expand those descriptions, and to have the implementation rules in a separate
document. In future revisions of the other parts of ISO 639, it is expected that those standards will reference
this part of ISO 639 rather than duplicating the information.

© ISO 2010 – All rights reserved v

---------------------- Page: 7 ----------------------

SIST ISO 639-4:2010

---------------------- Page: 8 ----------------------

SIST ISO 639-4:2010
INTERNATIONAL STANDARD ISO 639-4:2010(E)

Codes for the representation of names of languages —
Part 4:
General principles of coding of the representation of names of
languages and related entities, and application guidelines
1 Scope
This part of ISO 639 gives the general principles of language coding using the codes that are specified in the
other parts of ISO 639 and their combination with other codes. Furthermore, this part of ISO 639 lays down
guidelines for the use of any combination of the parts of ISO 639.
The terminology and general descriptions of this part of ISO 639 are intended to replace corresponding text of
other parts of ISO 639 as relevant in future revisions.
Relevant metadata for the description of linguistic entities are also given, as a framework for databases of
linguistic data to support the ISO 639 series of International Standards.
2 Normative references
The following referenced documents are indispensable for the application of this document. For dated
references, only the edition cited applies. For undated references, the latest edition of the referenced
document (including any amendments) applies.
ISO 639-1:2002, Codes for the representation of names of languages — Part 1: Alpha-2 code
ISO 639-2:1998, Codes for the representation of names of languages — Part 2: Alpha-3 code
ISO 639-3:2007, Codes for the representation of names of languages — Part 3: Alpha-3 code for
comprehensive coverage of languages
ISO 639-5:2008, Codes for the representation of names of languages — Part 5: Alpha-3 code for language
families and groups
ISO 3166-1:2006, Codes for the representation of names of countries and their subdivisions — Part 1:
Country codes
ISO 3166-2:2007, Codes for the representation of names of countries and their subdivisions — Part 2:
Country subdivision code
ISO 3166-3:1999, Codes for the representation of names of countries and their subdivisions — Part 3: Code
for formerly used names of countries
ISO 8601:2004, Data elements and interchange formats — Information interchange — Representation of
dates and times
ISO/IEC 11179-1:2004, Information technology — Metadata registries (MDR) — Part 1: Framework
© ISO 2010 – All rights reserved 1

---------------------- Page: 9 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
ISO/IEC 11179-2:2005, Information technology — Metadata registries (MDR) — Part 2: Classification
ISO/IEC 11179-3:2003, Information technology — Metadata registries (MDR) — Part 3: Registry metamodel
and basic attributes
ISO/IEC 11179-4:2004, Information technology — Metadata registries (MDR) — Part 4: Formulation of data
definitions
ISO/IEC 11179-5:2005, Information technology — Metadata registries (MDR) — Part 5: Naming and
identification principles
ISO/IEC 11179-6:2005, Information technology — Metadata registries (MDR) — Part 6: Registration
ISO 12620:2009, Terminology and other language and content resources — Specification of data categories
and management of a Data Category Registry for language resources
ISO 15924:2004, Information and documentation — Codes for the representation of names of scripts
ISO 19111:2007, Geographic information — Spatial referencing by coordinates
ISO 19112:2003, Geographic information — Spatial referencing by geographic identifiers
3 Terms and definitions
For the purposes of this document, the following terms and definitions apply.
In future versions of other parts of ISO 639, it is expected that some or all of the terms and definitions will be
replaced by a reference to the terms and definitions in this part of ISO 639.
NOTE The definitions in this part of ISO 639 are intended for practical use within the context of the various parts of
ISO 639 and their applications. For various linguistic purposes, there are needs for more detailed, and possibly deviating,
definitions.
3.1
code
data transformed or represented in different forms according to a pre-established set of rules
NOTE The usage of the term “code” is not uniform in all standardized coding systems. According to the usage that is
defined in this part of ISO 639, a “code” is to be understood as a code table (3.2) and the set of rules relating to the code
table. Each individual row in a code table is a code element (3.4) (e.g. “de - German - allemand - Deutsch” in Part 1 of
ISO 639), while the item “de” is the language identifier (3.5).
3.2
code table
table of code elements (3.4) as part of a code (3.1)
3.3
code space
totality of possible values for a set of identifiers within a code (3.1)
EXAMPLE All sequences of two letters (a–z) form the code space of the alpha-2 language code as specified in
part 1 of ISO 639.
NOTE The alpha-3 language codes that are specified in parts 2, 3, and 5 of ISO 639 share the same code space, i.e.
no language identifier assigned in one of the parts may be assigned to a different item in another part.
2 © ISO 2010 – All rights reserved

---------------------- Page: 10 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
3.4
code element
individual entry in a code (3.1)
NOTE In the language codes of ISO 639, each code element consists of a language identifier and the names of the
language.
3.5
language identifier
language symbol
string of characters assigned to a linguistic entity for the purpose of uniquely representing it
NOTE 1 In the language codes of Parts 1, 2, 3, and 5 of ISO 639, each language identifier is composed of two or three
letters.
NOTE 2 See 4.1.
3.6
language
systematic use of sounds, characters, symbols or signs to express or communicate meaning or a message
between humans
NOTE 1 This definition is intended to serve as a working definition for the purpose of the ISO 639 series of
International Standards, not as a universal definition of this concept.
NOTE 2 See also 4.1 and 4.2.
3.7
individual language
language (3.6) that is distinctly different from another language
NOTE See 4.2.
3.8
dialect
language variant (3.14) specific to a geographical region or a group of language users
NOTE See 4.5.
3.9
macrolanguage
language (3.6) that for some purpose may be subdivided into two or more individual languages (3.7)
NOTE See 4.3.
3.10
language group
two or more individual languages (3.7) that for a specific purpose may suitably be treated as a unit
NOTE See 4.6.
3.11
language family
two or more individual languages (3.7) that are related to each other through having common ancestry
NOTE In exceptional cases, a language family may have only one individual language as a member.
© ISO 2010 – All rights reserved 3

---------------------- Page: 11 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
3.12
remainder group
language group (3.10) with the explicit exclusion of specified languages
NOTE See 4.6.
3.13
language variation
continuous variation within and between individual languages (3.7)
NOTE Language variation is seen and may be described as variation over time, space, cultural affiliation, etc.
3.14
language variant
variant of an individual language (3.7) that may be identified and named
3.15
standard variant
language variant (3.14) with a high degree of status and normalization
NOTE A standard variant of a language may typically be used in official or public communication and in
communication between users of different language variants.
3.16
writing system
system for writing a language (3.6), including the script (3.17) and character set used
NOTE See also 4.9.
3.17
script
set of graphic characters used for the written form of one or more languages (3.6)
[ISO 15924:2004 and ISO/IEC 10646:2003]
NOTE See also 4.9.
3.18
orthography
set of rules for accepted spelling of words and text in one or more languages (3.6)
3.19
transcription
system for representing text in a different script (3.17) than that in which the text was originally represented
NOTE The resulting text is also referred to as a “transcription”.
3.20
transliteration
transcription (3.19) that enables the reconstruction of the original script (3.17) without any loss of
information about graphic characters
NOTE The resulting text is also referred to as a “transliteration”.
3.21
written language
individual language (3.7) or language variant (3.14) that is commonly represented in writing with a relatively
normalized orthography (3.18)
4 © ISO 2010 – All rights reserved

---------------------- Page: 12 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
3.22
spoken language
individual language (3.7) or language variant (3.14) that is represented in spoken form
NOTE Any spoken language may be represented in writing using a phonetic writing system, where characters
represent sounds (phones or phonemes) directly.
3.23
living language
individual language (3.7) or language variant (3.14) in present-day use, in particular as a spoken
language (3.22)
3.24
extinct language
individual language (3.7) or language variant (3.14) that is no longer in use and that has no present-day
descendant
NOTE See 4.7.
3.25
ancient language
extinct language (3.24) with a distinct literature and special status in the scholarly community
NOTE See 4.7.
3.26
historical language
known earlier historical stage of a living language (3.23) or an extinct language (3.24)
EXAMPLE “Old English” and “Middle English” as historical stages of “English”.
NOTE See 4.7.
3.27
natural language
language (3.6) for human communication that is not an artificial language (3.28)
3.28
artificial language
language (3.6) for human communication that has been artificially devised
NOTE See also 4.8.
4 Fundamental concepts of language coding
4.1 Language identifiers and languages
Language identifiers are composed of the following 26 letters of the Latin alphabet in lower case: a, b, c, d, e, f,
g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. No diacritical marks or modified characters are used.
A language identifier represents a language, which may also be represented by one or more language names.
The objects of identification are languages themselves; language names are the means by which the
languages denoted by language identifiers are designated.
Languages are not static objects every instantiation of which is identical to every other. Every language
corresponds to some range of variation in linguistic expression. In ISO 639, a language identifier denotes
some range of language variation. The range of variation that is denoted can have three different scopes:
individual language, macrolanguage or language group. Also, languages that are represented can be of
© ISO 2010 – All rights reserved 5

---------------------- Page: 13 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
various types: living languages, ancient languages, artificially constructed languages, etc. The following
provides further explanation regarding assignment of identifiers for different scopes or to different types of
languages in ISO 639.
4.2 Individual languages
Identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to denote distinct individual languages, unless the
language name explicitly refers to a language group.
There is no one definition of a “language” that is agreed upon by all and appropriate for all purposes. As a
result, there can be disagreement, even among speakers of the language or experts in linguistics, as to
whether two variants represent dialects of a single language or two distinct languages. For ISO 639,
judgments regarding when two variants are considered to be the same or different languages are based on a
number of factors, including linguistic similarity, intelligibility, a common literature, the views of speakers
concerning the relationship between language and identity, and other factors. The following basic criteria are
followed.
⎯ Two related variants are normally considered variants of the same language if speakers of each variant
have inherent understanding of the other variant (that is, can understand based on knowledge of their
own variant without needing to learn the other variant) at a functional level.
⎯ Where spoken intelligibility between variants is marginal, the existence of a common literature or of a
common ethnolinguistic identity with a central variant that both understand can be strong indicators that
they should nevertheless be considered variants of the same language.
⎯ Where there is enough intelligibility between variants to enable communication, the existence of well-
established distinct ethnolinguistic identities can be a strong indicator that they should nevertheless be
considered to be different languages.
Some of the distinctions made on this basis may not be considered appropriate by some users or for certain
applications. However, these basic criteria are thought to best fit the intended range of applications.
4.3 Macrolanguages
Parts 1 and 2 of ISO 639 include identifiers that correspond in a one-to-many manner with individual language
identifiers in Part 3 of ISO 639. For instance, Part 3 of ISO 639 contains over 30 identifiers designated as
individual language identifiers for distinct variants of Arabic, while Parts 1 and 2 each contain only one
identifier for Arabic, “ar” and “ara” respectively, which are designated as individual language identifiers in
those parts of ISO 639. It is assumed here that the single identifiers for Arabic in Parts 1 and 2 of ISO 639
correspond to the many identifiers collectively for distinct variants of Arabic in Part 3 of ISO 639.
In this example, it may appear that the single identifiers in Parts 1 and 2 of ISO 639 should be designated as
collective language identifiers. That is not assumed, however. In various parts of the world, there are clusters
of closely-related language variants that, based on the criteria discussed in 4.2, can be considered individual
languages, yet in certain usage contexts a single language identity for all is needed. Typical situations in
which this need can occur include the following.
⎯ There is one variant that is more developed and that tends to be used for wider communication by
speakers of various closely-related languages; as a result, there is a perceived common linguistic identity
across these languages. For instance, there are several distinct spoken Arabic languages, but Standard
Arabic is generally used in business and media across all of these communities, and is also an important
aspect of a shared ethno-religious unity. As a result, a perceived common linguistic identity exists.
⎯ There is a common written form used for multiple closely-related languages. For instance, multiple
Chinese languages share a common written form.
6 © ISO 2010 – All rights reserved

---------------------- Page: 14 ----------------------

SIST ISO 639-4:2010
ISO 639-4:2010(E)
⎯ There is a transitional sociolinguistic situation in which sub-communities of a single language community
are diverging, creating a need for some purposes to recognise distinct languages while, for other
purposes, a single common identity is still valid. For instance, in some business contexts it is necessary
to make a distinction between the languages Bosnian, Croatian, and Serbian; yet there are other contexts
in which these distinctions are not discernable in language resources that are in use.
Where such situations exist, an identifier for the single, common language identity is considered to be a
macrolanguage identifier.
Macrolanguages are distinguished from language groups in that the individual languages that correspond to a
macrolanguage must be very closely related, and there must be some domain in which only a single language
identity is recognized.
4.4 Linguistic norm
Some linguistic forms are “normalized” or “standardized” by official or private bodies like academies or
language councils. This normalization may be applied to any elements: orthography, morphology, syntax,
semantics, phonology, etc. The degree of normalization varies greatly from one language to another.
Languages or forms of languages may be considered to have some sort of official status within countries or
regions. Language status may be established through acts of parliament or through other formal procedures,
giving a language status as “national language”, “official language”, “regional language”, etc.
4.5 Dialects
The linguistic variants denoted by each of the identifiers in Parts 1, 2, and 3 of ISO 639 are assumed to be
distinct languages and not dialects of other languages, even though for some purposes some users may
consider a variant listed in Part 1 or 2, or in particular Part 3 of ISO 639 to be a “dialect” rather than a
“language” (see 4.2 and 4.3). In ISO 639, the term dialect is used as in the field of linguistics where it identifies
any sub-variant of a language such as might be based on geographic region, age, gender, social class, time
period, etc.
The dialects of a language are included within the denotation represented by the identifier for that language.
Thus, each language identifier represents the complete range of all the spoken or written variants of that
language, including any standardized form.
For applications in which it is necessary to identify dialects, a separate standard may be developed that
...

NORME ISO
INTERNATIONALE 639-4
Première édition
2010-07-15

Codes pour la représentation des noms
de langue —
Partie 4:
Principes généraux pour le codage de la
représentation des noms de langue et
d'entités connexes, et lignes directrices
pour la mise en œuvre
Codes for the representation of names of languages —
Part 4: General principles of coding of the representation of names of
languages and related entities, and application guidelines




Numéro de référence
ISO 639-4:2010(F)
©
ISO 2010

---------------------- Page: 1 ----------------------
ISO 639-4:2010(F)
PDF – Exonération de responsabilité
Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier
peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence
autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées
acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute
responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info
du fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir
l'exploitation de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation,
veuillez en informer le Secrétariat central à l'adresse donnée ci-dessous.


DOCUMENT PROTÉGÉ PAR COPYRIGHT


©  ISO 2010
Droits de reproduction réservés. Sauf prescription différente, aucune partie de cette publication ne peut être reproduite ni utilisée sous
quelque forme que ce soit et par aucun procédé, électronique ou mécanique, y compris la photocopie et les microfilms, sans l'accord écrit
de l'ISO à l'adresse ci-après ou du comité membre de l'ISO dans le pays du demandeur.
ISO copyright office
Case postale 56 • CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Publié en Suisse

ii © ISO 2010 – Tous droits réservés

---------------------- Page: 2 ----------------------
ISO 639-4:2010(F)
Sommaire Page
Avant-propos .iv
Introduction.v
1 Domaine d'application .1
2 Références normatives.1
3 Termes et définitions .2
4 Concepts fondamentaux de codage des langues.6
4.1 Indicatifs de langue et langues .6
4.2 Langues individuelles.6
4.3 Macrolangues .6
4.4 Norme linguistique .7
4.5 Dialectes.7
4.6 Codets de langues collectifs et groupes de langues .8
4.7 Langues mortes, anciennes et historiques .8
4.8 Langues artificielles .8
4.9 Systèmes d'écriture et écritures .8
5 Relations entre les parties de l'ISO 639 .8
5.1 Parties de l'ISO 639 .8
5.2 Norme ISO 639 comme espace de codage .9
5.3 Principes.9
5.4 Mise à jour commune et base de données de codage des langues .9
6 Problèmes d'implémentation .10
6.1 Applications .10
6.2 Sous-ensembles du tableau de codes .10
6.3 Groupes de langues .11
7 Combinaison des indicatifs de langue avec d'autres normes ou d'autres codes.11
7.1 Combinaison de l'ISO 639 avec l'ISO 3166 .11
7.2 Combinaison de l'ISO 639 avec l'ISO 19111 et l'ISO 19112.12
7.3 Combinaison de l'ISO 639 avec l'ISO 15924 .12
7.4 Autres combinaisons de codes .12
7.5 Format des indicatifs combinés .12
8 Format de description de la langue (LDF) .13
8.1 Compatibilité entre le modèle ISO 639 et l'ISO 12620.13
8.1.1 Généralités .13
8.1.2 Identification .15
8.1.3 Description d'un indicatif de langue ISO 639 .17
8.2 Extensions de l'ISO 639 au LDF de l'ISO 12620 .20
8.2.1 Représentation .20
8.2.2 Documentation .22
8.3 Informations sur la langue.24
Annexe A (informative) Direction générale de l'ISO 639 .26
Bibliographie.28

© ISO 2010 – Tous droits réservés iii

---------------------- Page: 3 ----------------------
ISO 639-4:2010(F)
Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de
normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée
aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du
comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec
la Commission électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,
Partie 2.
La tâche principale des comités techniques est d'élaborer les Normes internationales. Les projets de Normes
internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur
publication comme Normes internationales requiert l'approbation de 75 % au moins des comités membres
votants.
L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de
droits de propriété intellectuelle ou de droits analogues. L'ISO ne saurait être tenue pour responsable de ne
pas avoir identifié de tels droits de propriété et averti de leur existence.
L'ISO 639-4 a été élaborée par le comité technique ISO/TC 37, Terminologie et autres ressources langagières
et ressources de contenu, sous-comité SC 2, Méthodes de travail terminographiques et lexicographiques.
L'ISO 639 comprend les parties suivantes, présentées sous le titre général Codes pour la représentation des
noms de langue:
⎯ Partie 1: Code alpha-2
⎯ Partie 2: Code alpha-3
⎯ Partie 3: Code alpha-3 pour un traitement exhaustif des langues
⎯ Partie 4: Principes généraux pour le codage de la représentation des noms de langue et d'entités
connexes, et lignes directrices pour la mise en oeuvre
⎯ Partie 5: Code alpha-3 pour les familles de langues et groupes de langues
⎯ Partie 6: Code alpha-4 pour un traitement exhaustif des variantes linguistiques

iv © ISO 2010 – Tous droits réservés

---------------------- Page: 4 ----------------------
ISO 639-4:2010(F)
Introduction
L'ISO 639 fournit des codes pour l'identification et la spécification des langues individuelles, des variantes
linguistiques et des groupes de langues. Ces identificateurs peuvent s'utiliser dans de nombreuses
applications, y compris pour spécifier la langue d'un texte, la langue des termes ou des mots d'un dictionnaire
ou d'une base de données terminologique, la langue d'une présentation orale, le niveau de connaissance
d'une langue, les possibilités linguistiques d'un logiciel, la localisation, etc. L'implémentation des diverses
parties de l'ISO 639 est prévue pour de nombreux environnements.
Les Parties 1, 2, 3 et 5 de l'ISO 639 contiennent toutes des informations sur les problèmes d'implémentation.
Cependant, il s'avère nécessaire d'étendre ces descriptions et de stipuler les règles d'implémentation dans un
document séparé. Dans les futures révisions des autres parties de l'ISO 639, il est prévu qu'elles feront
référence à la présente partie de l'ISO 639, plutôt que de dupliquer les informations.

© ISO 2010 – Tous droits réservés v

---------------------- Page: 5 ----------------------
NORME INTERNATIONALE ISO 639-4:2010(F)

Codes pour la représentation des noms de langue —
Partie 4:
Principes généraux pour le codage de la représentation des
noms de langue et d'entités connexes, et lignes directrices pour
la mise en œuvre
1 Domaine d'application
La présente partie de l'ISO 639 fournit les principes généraux de codage des langues à l'aide des codes
spécifiés dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d'autres codes. De plus, la
présente partie de l'ISO 639 établit des règles d'utilisation de n'importe quelle combinaison des parties de
l'ISO 639.
La terminologie et les descriptions générales de la présente partie de l'ISO 639 sont destinées à remplacer le
texte correspondant des autres parties de l'ISO 639, selon le cas, dans de futures révisions.
Les métadonnées pertinentes pour la description des entités linguistiques sont également fournies et servent
de cadre de travail pour les bases de données linguistiques qui accompagnent la série de Normes
internationales ISO 639.
2 Références normatives
Les documents de référence suivants sont indispensables pour l'application du présent document. Pour les
références datées, seule l'édition citée s'applique. Pour les références non datées, la dernière édition du
document de référence s'applique (y compris les éventuels amendements).
ISO 639-1:2002, Codes pour la représentation des noms de langue — Partie 1: Code alpha-2
ISO 639-2:1998, Codes pour la représentation des noms de langue — Partie 2: Code alpha-3
ISO 639-3:2007, Codes pour la représentation des noms de langue — Partie 3: Code alpha-3 pour un
traitement exhaustif des langues
ISO 639-5:2008, Codes pour la représentation des noms de langue — Partie 5: Code alpha-3 pour les
familles de langues et groupes de langues
ISO 3166-1:2006, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 1: Codes
de pays
ISO 3166-2:2007, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 2: Code
pour les subdivisions de pays
ISO 3166-3:1999, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 3: Code
pour les noms de pays antérieurement utilisés
© ISO 2010 – Tous droits réservés 1

---------------------- Page: 6 ----------------------
ISO 639-4:2010(F)
ISO 8601:2004, Éléments de données et formats d'échange — Échange d'information — Représentation de
la date et de l'heure
ISO/CEI 11179-1:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 1: Cadre
ISO/CEI 11179-2:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 2:
Classification
ISO/CEI 11179-3:2003, Technologies de l'information — Registres de métadonnées (RM) — Partie 3:
Métamodèle de registre et attributs de base
ISO/CEI 11179-4:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 4:
Formulation des définitions de données
ISO/CEI 11179-5:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 5:
Principes de dénomination et d'identification
ISO/CEI 11179-6:2005, Technologies de l'information — Registres de métadonnées (RM) — Partie 6:
Enregistrement
ISO 12620:2009, Terminologie et autres ressources langagières et ressources de contenu — Spécification de
catégories de données et gestion d'un registre de catégories de données pour les ressources langagières
ISO 15924:2004, Information et documentation — Codes pour la représentation des noms d'écritures
ISO 19111:2007, Information géographique — Système de référence spatiales par coordonnées
ISO 19112:2003, Information géographique — Système de références spatiales par identificateurs
géographiques
3 Termes et définitions
Pour les besoins du présent document, les termes et définitions suivants s'appliquent.
Dans les futures versions des autres parties de l'ISO 639, il est prévu que tout ou partie des termes et
définitions seront remplacés par une référence aux termes et définitions de la présente partie de l'ISO 639.
NOTE Les définitions de la présente partie de l'ISO 639 sont destinées à l'utilisation pratique dans le contexte des
diverses parties de l'ISO 639 et de leurs applications. Pour certains objectifs linguistiques, il existe des besoins de
définitions plus détaillées ou qui dévient de celles données ici.
3.1
code
données transformées ou représentées sous différentes formes, selon un jeu de règles préétablies
NOTE L'utilisation du terme «code» n'est pas identique dans tous les systèmes de codage normalisés. Selon
l'utilisation définie dans la présente partie de l'ISO 639, un «code» est compris comme un tableau de codes (3.2) et
l'ensemble des règles relatives à ce tableau de codes. Chaque ligne d'un tableau de codes est un codet (3.4)
(par exemple, «de - German - allemand - Deutsch» dans la Partie 1 de l'ISO 639), alors que l'élément «de» est l'indicatif
de langue (3.5).
3.2
tableau de codes
tableau des codets (3.4) faisant partie d'un code (3.1)
3.3
espace de codage
totalité des valeurs possibles d'un ensemble d'indicatifs au sein d'un code (3.1)
2 © ISO 2010 – Tous droits réservés

---------------------- Page: 7 ----------------------
ISO 639-4:2010(F)
EXEMPLE Toutes les combinaisons de deux lettres (de a à z) forment l'espace de codage du code de la langue
alpha-2 spécifié dans la Partie 1 de l'ISO 639.
NOTE Les codes de langue alpha-3 spécifiés dans les Parties 2, 3 et 5 de l'ISO 639 partagent le même espace de
codage: aucun indicatif de langue affecté dans une des parties ne peut être affecté à un autre élément d'une autre partie.
3.4
codet
entrée individuelle d'un code (3.1)
NOTE Dans les codes de langues décrits de l'ISO 639, chaque codet se compose d'un indicatif de langue et des
noms de la langue correspondante.
3.5
indicatif de langue
symbole de langue
chaîne de caractères assignée à une entité linguistique afin de la représenter de façon unique
NOTE 1 Dans les codes de langues décrits dans les Parties 1, 2, 3 et 5 de l'ISO 639, chaque indicatif de langue se
compose de deux ou trois lettres.
NOTE 2 Voir 4.1.
3.6
langue
utilisation systématique de sons, caractères, symboles ou signes pour exprimer ou communiquer un sens ou
un message entre humains
NOTE 1 Cette définition est destinée à servir de définition de travail pour les besoins de la série de Normes
internationales ISO 639, et non de définition universelle de ce concept.
NOTE 2 Voir également 4.1 et 4.2.
3.7
langue individuelle
langue (3.6) distincte de toute autre
NOTE Voir 4.2.
3.8
dialecte
variante linguistique (3.14) propre à une zone géographique ou à un groupe d'utilisateurs d'une langue
NOTE Voir 4.5.
3.9
macrolangue
langue (3.6) qui, dans un but particulier, peut se subdiviser en deux ou plusieurs langues individuelles (3.7)
NOTE Voir 4.3.
3.10
groupe de langues
ensemble de deux ou plusieurs langues individuelles (3.7) qui, dans un but particulier, peut être traité
comme une seule unité
NOTE Voir 4.6.
© ISO 2010 – Tous droits réservés 3

---------------------- Page: 8 ----------------------
ISO 639-4:2010(F)
3.11
famille de langues
ensemble de deux ou plusieurs langues individuelles (3.7) apparentées du fait de leur origine commune
NOTE Dans certains cas exceptionnels, une famille de langues peut ne comprendre qu'une seule langue individuelle.
3.12
groupe restreint
groupe de langues (3.10) qui exclut explicitement des langues spécifiées
NOTE Voir 4.6.
3.13
variation linguistique
variante continue au sein et entre des langues individuelles (3.7)
NOTE Une variation linguistique peut être considérée comme une variation dans le temps, l'espace, ou du fait d'une
appartenance culturelle, etc.
3.14
variante linguistique
variante d'une langue individuelle (3.7) qu'il est possible d'identifier et de nommer
3.15
variante standard
variante linguistique (3.14) possédant un haut niveau de normalisation et d'état
NOTE Une variante standard d'une langue peut généralement s'utiliser dans une communication publique ou
officielle et pour la communication entre des utilisateurs de différentes variantes linguistiques
3.16
système d'écriture
système d'écriture d'une langue (3.6), y compris l'écriture (3.17) et le jeu de caractères utilisés
NOTE Voir également 4.9.
3.17
écriture
ensemble de caractères graphiques utilisé pour la forme écrite d'une ou plusieurs langues (3.6)
[ISO 15924:2004 et ISO/CEI 10646:2003]
NOTE Voir également 4.9.
3.18
orthographe
ensemble des règles régissant la manière admise d'écrire les mots et le texte d'une ou plusieurs langues
(3.6)
3.19
transcription
système de représentation d'un texte dans une écriture (3.17) différente du texte original
NOTE Le résultat textuel est également appelé «transcription».
4 © ISO 2010 – Tous droits réservés

---------------------- Page: 9 ----------------------
ISO 639-4:2010(F)
3.20
translittération
transcription (3.19) qui permet de reconstruire l'écriture (3.17) originale sans perdre d'informations sur les
caractères graphiques
NOTE Le résultat textuel est également appelé «translittération».
3.21
langue écrite
langue individuelle (3.7) ou variante linguistique (3.14) communément représentée par écrit avec une
orthographe (3.18) relativement normalisée
3.22
langue orale
langue individuelle (3.7) ou variante linguistique (3.14) représentée sous forme orale
NOTE Une langue orale peut se représenter par écrit à l'aide d'un système d'écriture phonétique dans lequel les
caractères représentent directement des sons (phonèmes).
3.23
langue vivante
langue individuelle (3.7) ou variante linguistique (3.14) actuellement utilisée, en particulier sous forme
orale (3.22)
3.24
langue morte
langue individuelle (3.7) ou variante linguistique (3.14) qui n'est plus utilisée et qui n'a pas de langue
héritée encore en usage
NOTE Voir 4.7.
3.25
langue ancienne
langue morte (3.24) dotée d'une littérature et d'un état particulier dans la communauté scientifique
NOTE Voir 4.7.
3.26
langue historique
état historique précédemment connu d'une langue vivante (3.23) ou d'une langue morte (3.24)
EXEMPLE L'anglo-saxon anglais et l'anglais médiéval sont des langues historiques de l'anglais.
NOTE Voir 4.7.
3.27
langue naturelle
langue (3.6) utilisée pour la communication humaine et qui n'est pas une langue artificielle (3.28)
3.28
langue artificielle
langue (3.6) utilisée pour la communication humaine et conçue artificiellement
NOTE Voir également 4.8.
© ISO 2010 – Tous droits réservés 5

---------------------- Page: 10 ----------------------
ISO 639-4:2010(F)
4 Concepts fondamentaux de codage des langues
4.1 Indicatifs de langue et langues
Les indicatifs de langue sont composés des 26 lettres suivantes, en minuscule, de l'alphabet latin: a, b, c, d, e,
f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z. Aucun signe diacritique ou caractère modifié n'est utilisé.
Un indicatif de langue représente une langue qui peut également se représenter par un ou plusieurs noms de
langues. Les objets de l'identification sont les langues elles-mêmes; les noms de langue sont des moyens par
lesquels sont désignées les langues dénommées par les indicatifs de langue.
Les langues ne sont pas des objets statiques dont chaque instanciation est identique à chaque autre. Chaque
langue correspond à une certaine plage de variation de l'expression linguistique. Dans l'ISO 639, un indicatif
de langue désigne donc une certaine plage de variante linguistique. La plage de variante indiquée peut avoir
trois domaines d'application différents: langue individuelle, macrolangue et groupe de langues. De plus, les
langues représentées peuvent être de divers types: langues vivantes, langues anciennes, langues construites
artificiellement, etc. L'exposé suivant fournit une explication plus détaillée de l'attribution des indicatifs pour les
différents domaines d'application ou pour les différents types de langues dans l'ISO 639.
4.2 Langues individuelles
Les indicatifs des Parties 1, 2 et 3 de l'ISO 639 sont censés indiquer des langues individuelles différentes, à
moins que le nom de la langue fasse explicitement référence à un groupe de langues.
Il n'existe pas de définition unique d'une «langue» qui soit acceptée par tous et qui convienne à tous les
besoins. Par conséquent, il peut y avoir désaccord, même entre locuteurs de la langue ou entre linguistes, sur
la question de savoir si deux variantes représentent des dialectes d'une même langue ou deux langues
distinctes. Dans le cadre de l'ISO 639, les jugements pour savoir si deux variantes sont considérées
représenter la même langue ou des langues différentes sont basés sur divers facteurs, notamment la
similarité linguistique, l'intelligibilité, une littérature commune, les points de vue des locuteurs sur la relation
entre langue et identité, pour n'en citer que quelques-uns. Les critères fondamentaux suivants s'appliquent.
⎯ Deux variantes liées sont normalement considérées comme étant des variantes de la même langue si les
personnes parlant chaque variante ont une compréhension fonctionnelle spontanée de l'autre variante
(c'est-à-dire qu'elles peuvent la comprendre en s'appuyant sur la connaissance de leur propre variante
sans devoir apprendre l'autre variante).
⎯ Lorsque l'intelligibilité orale entre variantes est marginale, l'existence d'une littérature commune ou d'une
identité ethnolinguistique commune avec une variante centrale comprise par ces deux variantes peut
fortement indiquer qu'il conviendrait néanmoins de les considérer comme des variantes de la même
langue.
⎯ Lorsqu'il existe entre les variantes une intelligibilité suffisante qui permette de communiquer, l'existence
d'identités ethnolinguistiques distinctes bien établies peut fortement indiquer qu'il conviendrait néanmoins
de les considérer comme des langues différentes.
Certaines des distinctions établies sur ces bases peuvent ne pas être considérées comme appropriées par
certains usagers ou pour certaines applications. Toutefois, ces critères fondamentaux sont considérés comme
étant ceux qui s'adaptent le mieux à la gamme visée d'applications.
4.3 Macrolangues
Les Parties 1 et 2 de l'ISO 639 comprennent des indicatifs qui correspondent, dans une relation «un à
plusieurs», à des indicatifs de langue individuelle de la Partie 3 de l'ISO 639. Par exemple, la Partie 3 de
l'ISO 639 contient plus de 30 indicatifs désignés comme identificateurs de langue individuelle pour différentes
variantes de l'arabe, alors que les Parties 1 et 2 contiennent chacune un seul indicatif pour l'arabe,
respectivement «ar» et «ara», qui est appelé indicatif de langue individuelle dans ces parties de l'ISO 639. Il
est supposé ici que les indicatifs uniques pour l'arabe dans les Parties 1 et 2 de l'ISO 639 correspondent aux
nombreux indicatifs collectivement désignés pour les variétés de l'arabe dans la Partie 3 de l'ISO 639.
6 © ISO 2010 – Tous droits réservés

---------------------- Page: 11 ----------------------
ISO 639-4:2010(F)
Dans cet exemple, il peut sembler qu'il conviendrait d'appeler indicatifs de langue collectifs les indicatifs
uniques des Parties 1 et 2 de l'ISO 639. Ce n'est toutefois pas l'hypothèse admise ici. Dans diverses parties
du monde, il existe des groupes de variantes linguistiques intimement apparentées qui, sur la base des
critères exposés en 4.2, peuvent être considérés comme des langues individuelles, alors que dans certains
contextes d'utilisation, une seule identité de langue sera nécessaire pour l'ensemble de ces langues. Les
situations type où peut apparaître ce besoin sont les suivantes.
⎯ Il existe une variante plus développée qui tend à être utilisée pour une communication plus large par les
locuteurs de diverses langues étroitement apparentées; par conséquent, une identité linguistique
commune est perçue à travers ces langues. Par exemple, il existe plusieurs langues distinctes pour
l'arabe parlé mais l'arabe standard, généralement utilisé dans les affaires et dans les médias par toutes
ces communautés, représente également un aspect important de l'unité ethno-religieuse commune. Par
conséquent, il existe une identité linguistique commune perçue.
⎯ Il existe une forme écrite commune qui est utilisée pour plusieurs langues étroitement apparentées. Par
exemple, plusieurs langues chinoises partagent la même forme écrite.
⎯ Il existe une situation sociolinguistique transitoire dans laquelle des sous-communautés d'une même
communauté linguistique divergent, créant la nécessité, pour un certain nombre de besoins, de
reconnaître des langues distinctes alors que, pour d'autres besoins, une identité commune unique reste
valide. Par exemple, dans un certain nombre de contextes d'affaires, il est nécessaire de faire la
distinction entre les langues bosniaque, croate et serbe alors que dans d'autres contextes, ces
distinctions ne sont pas discernables en termes de ressources linguistiques utilisées.
Dans de telles situations, un indicatif pour l'unique identité linguistique commune est considéré comme un
indicatif de macrolangue.
Les macrolangues se distinguent des groupes de langues par le fait que les langues individuelles qui
correspondent à une macrolangue doivent être très étroitement apparentées et qu'il doit exister un domaine
où seule une identité linguistique unique est reconnue.
4.4 Norme linguistique
Certaines formes linguistiques sont «normalisées» ou «standardisées» par des organismes officiels ou privés
tels que des académies ou des comités linguistiques. Cette normalisation peut s'appliquer à divers éléments:
orthographe, morphologie, syntaxe, sémantique, phonétique, etc. Le degré de normalisation varie
considérablement d'une langue à l'autre.
Les langues ou leurs formes linguistiques peuvent être considérées comme ayant un certain statut officiel
dans certains pays ou régions. Le statut de la langue peut être établi par des actes pa
...

PROJET DE NORME INTERNATIONALE ISO/DIS 639-4
ISO/TC 37/SC 2 Secrétariat: SCC
Début de vote: Vote clos le:
2006-12-22 2007-05-22
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION • МЕЖДУНАРОДНАЯ ОРГАНИЗАЦИЯ ПО СТАНДАРТИЗАЦИИ • ORGANISATION INTERNATIONALE DE NORMALISATION
Codes pour la représentation des noms de langue —
Partie 4:
Lignes directrices pour la mise en oeuvre et principes généraux
des codes de langue
Codes for the representation of names of languages —
Part 4: Implementation guidelines and general principles for language coding
ICS 01.140.20

Pour accélérer la distribution, le présent document est distribué tel qu'il est parvenu du
secrétariat du comité. Le travail de rédaction et de composition de texte sera effectué au
Secrétariat central de l'ISO au stade de publication.
To expedite distribution, this document is circulated as received from the committee secretariat.
ISO Central Secretariat work of editing and text composition will be undertaken at publication
stage.
CE DOCUMENT EST UN PROJET DIFFUSÉ POUR OBSERVATIONS ET APPROBATION. IL EST DONC SUSCEPTIBLE DE MODIFICATION ET NE PEUT
ÊTRE CITÉ COMME NORME INTERNATIONALE AVANT SA PUBLICATION EN TANT QUE TELLE.
OUTRE LE FAIT D'ÊTRE EXAMINÉS POUR ÉTABLIR S'ILS SONT ACCEPTABLES À DES FINS INDUSTRIELLES, TECHNOLOGIQUES ET
COMMERCIALES, AINSI QUE DU POINT DE VUE DES UTILISATEURS, LES PROJETS DE NORMES INTERNATIONALES DOIVENT PARFOIS ÊTRE
CONSIDÉRÉS DU POINT DE VUE DE LEUR POSSIBILITÉ DE DEVENIR DES NORMES POUVANT SERVIR DE RÉFÉRENCE DANS LA
RÉGLEMENTATION NATIONALE.
© Organisation internationale de normalisation, 2006

---------------------- Page: 1 ----------------------
ISO/DIS 639-4
PDF — Exonération de responsabilité
Le présent fichier PDF peut contenir des polices de caractères intégrées. Conformément aux conditions de licence d'Adobe, ce fichier
peut être imprimé ou visualisé, mais ne doit pas être modifié à moins que l'ordinateur employé à cet effet ne bénéficie d'une licence
autorisant l'utilisation de ces polices et que celles-ci y soient installées. Lors du téléchargement de ce fichier, les parties concernées
acceptent de fait la responsabilité de ne pas enfreindre les conditions de licence d'Adobe. Le Secrétariat central de l'ISO décline toute
responsabilité en la matière.
Adobe est une marque déposée d'Adobe Systems Incorporated.
Les détails relatifs aux produits logiciels utilisés pour la création du présent fichier PDF sont disponibles dans la rubrique General Info du
fichier; les paramètres de création PDF ont été optimisés pour l'impression. Toutes les mesures ont été prises pour garantir l'exploitation
de ce fichier par les comités membres de l'ISO. Dans le cas peu probable où surviendrait un problème d'utilisation, veuillez en informer
le Secrétariat central à l'adresse donnée ci-dessous.
Notice de droit d'auteur
Ce document de l'ISO est un projet de Norme internationale qui est protégé par les droits d'auteur de l'ISO.
Sauf autorisé par les lois en matière de droits d'auteur du pays utilisateur, aucune partie de ce projet ISO ne
peut être reproduite, enregistrée dans un système d'extraction ou transmise sous quelque forme que ce soit
et par aucun procédé, électronique ou mécanique, y compris la photocopie, les enregistrements ou autres,
sans autorisation écrite préalable.
Les demandes d'autorisation de reproduction doivent être envoyées à l'ISO à l'adresse ci-après ou au comité
membre de l'ISO dans le pays du demandeur.
ISO copyright office
Case postale 56  CH-1211 Geneva 20
Tel. + 41 22 749 01 11
Fax + 41 22 749 09 47
E-mail copyright@iso.org
Web www.iso.org
Toute reproduction est soumise au paiement de droits ou à un contrat de licence.
Les contrevenants pourront être poursuivis.
©
ii ISO 2006 – Tous droits réservés

---------------------- Page: 2 ----------------------
ISO/DIS 639-4
Sommaire Page
Avant-propos .v
Introduction.vi
1 Domaine d'application .1
2 Références normatives.1
3 Termes et définitions .2
4 Concepts fondamentaux de codage des langues.6
4.1 Indicatifs de langue et langues.6
4.2 Langues individuelles.6
4.3 Macro-langues .6
4.4 Norme linguistique.7
4.5 Dialectes.7
4.6 Codets de langues collectifs et groupes de langues .8
4.7 Langues mortes, anciennes et historiques .8
4.8 Langues abstraites.8
4.9 Systèmes d’écriture et écritures.8
5 Relations entre les parties de l'ISO 639 .9
5.1 Parties de l'ISO 639 .9
5.2 Norme ISO 639 comme espace de codage .9
5.3 Principes .9
5.4 Mise à jour commune et base de données de codage des langues .10
6 Direction générale de l'ISO 639.10
6.1 Agences d'enregistrement et responsabilités concernant les parties de l'ISO 639.10
6.2 Comité consultatif mixte ISO 639/RA-JAC.10
6.2.1 Composition.10
6.2.2 Nomination des membres .10
6.2.3 Secrétariat .10
6.3 Procédures de travail au sein de l’ISO 639/RA-JAC .11
6.4 Ajout et suppression à la liste des entités, modification d’indicatifs.11
6.5 Réservation des indicatifs.11
6.6 Création d’indicatifs de langues.11
6.7 Procédures de vote .11
6.8 Stabilité des tableaux de codes.11
7 Problèmes d'implémentation .12
7.1 Applications .12
7.2 Sous-ensembles du tableau de codes .12
7.3 Groupes de langues.13
8 Combinaison des indicatifs avec d’autres normes ou d’autres codes .13
8.1 Combinaison de l'ISO 639 avec l'ISO 3166 .13
8.2 Combinaison de l'ISO 639 avec l'ISO 19111 et l'ISO 19112.14
8.3 Combinaison de l'ISO 639 avec l'ISO 15924 .14
8.4 Autres combinaisons de codes .14
8.5 Formats des indicatifs combinés .14
© ISO 2006 – Tous droits réservés iii

---------------------- Page: 3 ----------------------
ISO/DIS 639-4
9 Format de description de la langue (LDF). 15
9.1 Compatibilités entre le modèle ISO 639 et l'ISO 12620. 15
9.1.1 Identification. 16
9.1.2 Description d’un indicatif de langue ISO 639 . 18
9.2 Extensions de l'ISO 639 à l'ISO 12620 pour LDF . 21
9.2.1 Représentation. 21
9.2.2 Documentation. 23
9.3 Informations sur la langue. 24
9.3.1 Informations calculables sur la langue . 24
9.3.2 Attribution des noms aux langues. 25
9.3.3 Informations sur le pays . 25
9.3.4 Informations sur la langue « dépendant du pays ». 25
9.3.5 Documentation de référence . 26
9.3.6 Informations géographiques . 26
9.3.7 Informations socioculturelles. 26
9.3.8 Caractéristiques linguistiques . 26
Bibliographie . 27

iv © ISO 2006 – Tous droits réservés

---------------------- Page: 4 ----------------------
ISO/DIS 639-4
Avant-propos
L'ISO (Organisation internationale de normalisation) est une fédération mondiale d'organismes nationaux de
normalisation (comités membres de l'ISO). L'élaboration des Normes internationales est en général confiée
aux comités techniques de l'ISO. Chaque comité membre intéressé par une étude a le droit de faire partie du
comité technique créé à cet effet. Les organisations internationales, gouvernementales et non
gouvernementales, en liaison avec l'ISO participent également aux travaux. L'ISO collabore étroitement avec
la Commission électrotechnique internationale (CEI) en ce qui concerne la normalisation électrotechnique.
Les Normes internationales sont rédigées conformément aux règles données dans les Directives ISO/CEI,
Partie 2.
La tâche principale des comités techniques est d'élaborer les Normes internationales. Les projets de Normes
internationales adoptés par les comités techniques sont soumis aux comités membres pour vote. Leur
publication comme Normes internationales requiert l'approbation de 75 % au moins des comités membres
votants.
L'attention est appelée sur le fait que certains des éléments du présent document peuvent faire l'objet de
droits de propriété intellectuelle ou de droits analogues. L'ISO ne saurait être tenue pour responsable de ne
pas avoir identifié de tels droits de propriété et averti de leur existence.
L'ISO 639-4 a été élaborée par le comité technique ISO/TC 37, Terminologie, autres ressources langagières
et contenus, sous-comité SC 2, Méthodes de travail terminographiques et lexicographiques.
L'ISO 639 comprend les parties suivantes, présentées sous le titre général Codes pour la représentation des
noms de langue :
⎯ Partie 1 : Code Alpha-2
⎯ Partie 2 : Code Alpha-3
1
⎯ Partie 3 : Code Alpha-3 pour un traitement exhaustif des langues
2
⎯ Partie 4 : Guide d'implémentation et principes généraux des codes de langue. [ce document]
⎯ Partie 5 : Code Alpha-3 pour les familles de langues et les groupes de langues
La Partie 6 est en cours d’élaboration :
⎯ Partie 6 : Représentation Alpha-4 pour un traitement exhaustif de la variation linguistique

1) À publier.
2) À publier.
© ISO 2006 – Tous droits réservés v

---------------------- Page: 5 ----------------------
ISO/DIS 639-4
Introduction
L’ISO 639 fournit des codes pour l’identification et la spécification de différentes langues et variantes
linguistiques ainsi que de différents groupes de langues. Ces identificateurs peuvent s’utiliser dans de
nombreuses applications, y compris pour spécifier la langue d’un texte, la langue des termes ou des mots
d’un dictionnaire ou d’une base de données terminologique, la langue d’une présentation orale, le niveau de
connaissance d’une langue, les possibilités linguistiques d’un logiciel, la localisation, etc. L’implémentation
des diverses parties de l'ISO 639 est prévue pour de nombreux environnements.
Les Parties 1, 2, 3 et 5 de l'ISO 639 contiennent toutes des informations sur les problèmes d’implémentation.
Cependant, il s’avère nécessaire d’étendre ces descriptions et de stipuler les règles d’implémentation dans un
document séparé. Dans les futures révisions des autres parties de la présente norme, il est prévu que ces
normes feront référence à cette partie de l'ISO 639, plutôt que de dupliquer les informations.
vi © ISO 2006 – Tous droits réservés

---------------------- Page: 6 ----------------------
PROJET DE NORME INTERNATIONALE ISO/DIS 639-4

Codes pour la représentation des noms de langue —
Partie 4:
Lignes directrices pour la mise en oeuvre et principes généraux
des codes de langue
1 Domaine d'application
La présente partie de l'ISO 639 fournit les principaux généraux de codage des langues à l’aide des codes
spécifiés dans les autres parties de l'ISO 639, ainsi que leur combinaison avec d’autres codes. De plus, la
présente partie de l'ISO 639 établit des règles d’utilisation de n’importe quelle combinaison des parties de la
norme. Les données pertinentes pour la description des unités linguistiques sont également fournies et
servent de cadre de travail pour les bases de données qui prennent en charge la série de normes ISO 639.
2 Références normatives
Les documents normatifs suivants contiennent des dispositions qui, par suite de la référence qui y est faite,
constituent des dispositions valables pour la présente partie de l’ISO 639. Pour les références datées, les
amendements ultérieurs ou les révisions de ces publications ne s’appliquent pas. Toutefois, les
parties prenantes aux accords fondés sur la présente partie de l’ISO 639 sont invitées à rechercher la
possibilité d'appliquer les éditions les plus récentes des documents normatifs indiqués ci-après. Pour les
références non datées, la dernière édition du document normatif en référence s’applique. Les membres de
l'ISO et de la CEI possèdent le registre des Normes internationales en vigueur.
ISO 639-1:2002, Codes pour la représentation des noms de langue — Partie 1: Code alpha-2.
ISO 639-2:1998, Codes pour la représentation des noms de langue — Partie 2: Code alpha-3.
ISO 639-3:—, Codes pour la représentation des noms de langue — Partie 3: Code alpha-3 pour un traitement
3
exhaustif des langues.
ISO 639-5:—, Codes pour la représentation des noms de langue — Partie 5 : Code alpha-3 pour les familles
4
de langues et groupes de langues. .
ISO 3166-1:1997, Codes pour la représentation des noms de pays et de leurs subdivisions —
5
Partie 1 : Codes pays.
ISO 3166-2:1998, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 2 : code
6
pour les subdivisions de pays. .
ISO 3166-3:1999, Codes pour la représentation des noms de pays et de leurs subdivisions — Partie 3 : Code
pour les noms de pays antérieurement utilisés.

3) À publier.
4) À publier.
5) En cours de révision ; FDIS 2006-05.
6) En cours de révision ; DIS 2005-09.
© ISO 2006 – Tous droits réservés 1

---------------------- Page: 7 ----------------------
ISO/DIS 639-4
ISO 8601:2004, Éléments de données et formats d'échange — Échange d'information — Représentation de
la date et de l'heure.
ISO/CEI 10646:2003, Technologies de l'information — Jeu universel de caractères codés sur plusieurs octets
(JUC).
ISO/CEI 11179-1:2004, Technologies de l'information — Registres de métadonnées (RM) — Partie 1 : Cadre.
ISO/CEI 11179-2:2005, Technologies de l'information — Registres de métadonnées (RM) —
Partie 2 : classification.
ISO/CEI 11179-3:2003, Technologies de l'information — Registres de métadonnées (MDR) —
Partie 3 : métamodèle de registre et attributs de base.
ISO/CEI 11179-4:2004, Technologies de l'information — Registres de métadonnées (RM) —
Partie 4 : Formulation des définitions de données.
ISO/CEI 11179-5:2005, Technologies de l'information — Registres de métadonnées (RM) —
Partie 5 : principes de dénomination et d'identification.
ISO/CEI 11179-6:2005, Technologies de l'information — Registres de métadonnées (RM) —
Partie 6 : Enregistrement.
7
ISO 12620:1999, Aides informatiques en terminologie — Catégories de données.
ISO 15924:2004, Information et documentation — Codes pour la représentation des noms d'écritures.
ISO 16642:2003, Applications informatiques en terminologie — Plate-forme pour le balisage de terminologies
informatisées.
ISO 19111:2003, Information géographique — Système de référence spatiales par coordonnées.
ISO 19112:2003, Information géographique — Système de références spatiales par identificateurs
géographiques.
3 Termes et définitions
Pour les besoins de la présente partie de l'ISO 639, les termes et définitions suivants s'appliquent.
Dans les futures versions de l'ISO 639, il est prévu que certains termes et définitions, ou tous, soient
remplacés par une référence aux termes et définitions de la présente partie de l'ISO 639.
NOTE Les définitions de la présente partie de l'ISO 639 sont destinées à l’utilisation pratique dans le contexte des
diverses parties de cette norme et de leurs applications. Pour quelques objectifs linguistiques, il existe des besoins de
définitions plus détaillées, et éventuellement dérivées.
3.1
code
données transformées ou représentées sous différentes formes, selon un jeu de règles préétablies
NOTE L’utilisation du terme « code » n’est pas identique dans tous les systèmes de codage normalisés. En fonction
de l’utilisation définie dans la présente partie de l'ISO 639, un « code » doit être compris comme un tableau de codes (3.2)
et l’ensemble des règles relatives à ce tableau. Chaque ligne d’un tableau de codes est un codet de langue (3.4) (par
exemple, « de - German - allemande – Deutsch » dans la Partie 1 de l'ISO 639), alors que l’élément « de » est l’indicatif
de la langue (3.5).

7) En cours de révision.
2 © ISO 2006 – Tous droits réservés

---------------------- Page: 8 ----------------------
ISO/DIS 639-4
3.2
tableau de codes
tableau des codets faisant partie d’un code
3.3
espace de codage
totalité des valeurs possibles d’un ensemble d’indicatifs au sein d’un code
EXEMPLE Toutes les suites de deux lettres (aa–zz) forment l’espace de codage du code de la langue alpha-2
spécifié dans la Partie 1 de la norme ISO.
NOTE Les codes de langue alpha-3 spécifiés dans les Parties 2, 3 et 5 de l'ISO 639 partagent le même espace de
codage : aucun indicatif de langue affecté dans une des parties ne peut être affecté à un autre élément d’une autre partie.
3.4
codet
entrée individuelle d’un code
NOTE Dans les codes de langues décrits de l'ISO 639, chaque codet se compose d’un indicatif de langue et des
noms de la langue correspondante.
3.5
indicatif de langue
symbole de langue
chaîne de lettres assignée à une unité linguistique dans le but de la représenter de façon unique
NOTE 1 Dans les codes de langues décrits dans les Parties 1, 2, 3 et 5 de l'ISO 639, chaque indicatif de langue se
compose de deux ou trois lettres.
NOTE 2 Voir 4.1.
3.6
langue
utilisation systématique de sons, caractères, symboles ou signes pour exprimer ou communiquer un sens ou
un message
NOTE Voir également 4.1 et 4.2.
3.7
langue individuelle
langue (3.6) distincte de toute autre
NOTE Voir 4.2.
3.8
dialecte
variante linguistique (3.14) propre à une zone géographique ou à un groupe d’utilisateurs d’une langue
NOTE Voir 4.5.
3.9
macro-langue
langue (3.6) qui, dans un but particulier, peut se subdiviser en deux ou plusieurs langues individuelles (3.7)
NOTE Voir 4.3.
3.10
groupe de langues
ensemble de deux ou plusieurs langues individuelles (3.7) qui, dans un but particulier, peut être traité
comme une seule unité
© ISO 2006 – Tous droits réservés 3

---------------------- Page: 9 ----------------------
ISO/DIS 639-4
NOTE Voir 4.6.
3.11
famille de langues
ensemble de deux ou plusieurs langues individuelles (3.7) apparentées du fait de leur origine commune
NOTE Dans certains cas exceptionnels, une famille de langues peut ne comprendre qu’une seule langue
individuelle.
3.12
groupe restreint
groupe de langues (3.10) qui exclut explicitement des langues spécifiées
NOTE Voir 4.6.
3.13
variation linguistique
variante continue au sein et entre des langues individuelles (3.7)
NOTE Une variation linguistique peut être considérée comme une variation dans le temps, l’espace, du fait d’une
appartenance culturelle, etc.
3.14
variante linguistique
variante d’une langue individuelle (3.7) qu’il est possible d’identifier et de nommer
3.15
variante standard
variante linguistique (3.14) possédant un haut niveau de normalisation et d’état
NOTE Une variante standard d’une langue peut généralement s’utiliser dans une communication publique ou
officielle et pour la communication entre des utilisateurs de différentes variantes linguistiques
3.16
système d’écriture
système d’écriture d’une langue (3.6), y compris l’écriture (3.17) et le jeu de caractères utilisés
NOTE Voir également 4.9.
3.17
écriture
ensemble de caractères graphiques utilisé pour la forme écrite d’une ou plusieurs langues
[ISO 15924 et ISO/CEI 10646]
NOTE Voir également 4.9.
3.18
orthographe
ensemble de règles d’orthographe applicable aux mots et au texte d’une ou plusieurs langues
3.19
transcription
système de représentation d’un texte dans une écriture différente du texte original
NOTE Le résultat textuel est également appelé « transcription ».
4 © ISO 2006 – Tous droits réservés

---------------------- Page: 10 ----------------------
ISO/DIS 639-4
3.20
translittération
transcription (3.19) qui permet de reconstruire l’écriture originale sans perdre d’informations
NOTE Le résultat textuel est également appelé « translittération ».
3.21
langue écrite
langue individuelle (3.7) ou variante linguistique (3.14) communément représentée par écrit avec une
orthographe relativement normalisée (3.18)
3.22
langue orale
langue individuelle (3.7) ou variante linguistique (3.14) représentée sous forme orale
NOTE Une langue orale peut se représenter par écrit à l’aide d’un système d’écriture phonétique dans lequel les
caractères représentent directement des sons (phonèmes).
3.23
langue vivante
langue individuelle (3.7) ou variante linguistique (3.14) actuellement utilisée, en particulier sous forme
orale
3.24
langue morte
langue individuelle (3.7) ou variante linguistique (3.14) qui n’est plus utilisée et qui n’a pas de langue
héritée
NOTE Voir 4.7.
3.25
langue ancienne
langue morte (3.24) dotée d’une littérature et d’un état particulier dans la communauté scientifique
NOTE Voir 4.7.
3.26
langue historique
état historique précédemment connu d’une langue vivante (3.23) ou d’une langue morte (3.24)
EXEMPLE L'anglo-saxon anglais et l’anglais médiéval sont des langues historiques de l’anglais.
NOTE Voir 4.7.
3.27
langue naturelle
langue (3.6) utilisée pour la communication humaine et qui n’est pas une langue artificielle (3.28)
3.28
langue artificielle
langue (3.6) utilisée pour la communication humaine et conçue artificiellement
NOTE Voir également 4.8.
© ISO 2006 – Tous droits réservés 5

---------------------- Page: 11 ----------------------
ISO/DIS 639-4
4 Concepts fondamentaux de codage des langues
4.1 Indicatifs de langue et langues
Un indicatif de langue représente une langue qui peut également se représenter par un ou plusieurs noms de
langues. Les objets de l'identification sont les langues elles-mêmes ; les noms de langue sont des moyens
par lesquels sont désignées les langues dénommées par les indicatifs de langue.
Les langues ne sont pas des objets statiques dont chaque instanciation est identique à chaque autre. Chaque
langue correspond à une certaine plage de variation de l'expression linguistique. Dans les diverses parties
de l'ISO 639, un indicatif de langue désigne donc une certaine plage de variante linguistique. La plage de
variante indiquée peut avoir trois domaines d'application différents : langue individuelle, macro-langue et
groupe de langues. De plus, les langues représentées peuvent être de divers types : langues vivantes,
langues anciennes, langues construites artificiellement, etc. L'exposé suivant fournit une explication plus
détaillée de l'attribution des indicatifs pour les différents domaines d'application ou pour les différents types de
langues dans l'ISO 639.
4.2 Langues individuelles
Les indicatifs des Parties 1, 2 et 3 de l'ISO 639 sont censés indiquer des langues individuelles différentes, à
moins que le nom de la langue fasse explicitement référence à un groupe de langues.
Il n'existe pas de définition unique d’une « langue » qui soit acceptée par tous et qui convienne à tous les
besoins. Par conséquent, il peut y avoir désaccord, même entre locuteurs ou entre linguistes, sur la question
de savoir si deux variantes représentent des dialectes d'une même langue ou deux langues distinctes.
Pour l'ISO 639, les jugements pour savoir si deux variantes sont considérées représenter la même langue ou
des langues différentes sont basés sur divers facteurs, notamment la similarité linguistique, l'intelligibilité, une
littérature commune, les points de vue des locuteurs sur la relation entre langue et identité, pour n’en citer que
quelques-uns. Les critères fondamentaux suivants s’appliquent :
⎯ deux variantes liées sont normalement considérées comme étant des variantes de la même langue si les
personnes parlant chaque variante ont une compréhension fonctionnelle spontanée de l'autre variante
(c'est-à-dire qu'elles peuvent la comprendre en s'appuyant sur la connaissance de leur propre variante
sans devoir apprendre l'autre variante) ;
⎯ lorsque l'intelligibilité orale entre variantes est marginale, l'existence d'une littérature commune ou d'une
identité ethnolinguistique commune avec une variante centrale comprise par ces deux variantes peut
fortement indiquer qu'il conviendrait néanmoins de les considérer comme des variantes de la même
langue ;
⎯ lorsqu'il existe entre les variantes une intelligibilité suffisante qui permette de communiquer, l'existence
d'identités ethnolinguistiques distinctes bien établies peut fortement indiquer qu'il conviendrait néanmoins
de
...

Questions, Comments and Discussion

Ask us and Technical Secretary will try to provide an answer. You can facilitate discussion about the standard in here.