mirror of
https://github.com/freedomofpress/dangerzone.git
synced 2025-04-28 18:02:38 +02:00
Sort OCR languages by tesseract arg name
Make it easier to compare the list of languages with the output of `tesseract --list-langs`.
This commit is contained in:
parent
d768099912
commit
66d3c40163
1 changed files with 91 additions and 91 deletions
|
@ -1,162 +1,162 @@
|
||||||
{
|
{
|
||||||
"Afrikaans": "ar",
|
|
||||||
"Albanian": "sqi",
|
|
||||||
"Amharic": "amh",
|
|
||||||
"Arabic": "ara",
|
|
||||||
"Arabic script": "Arabic",
|
"Arabic script": "Arabic",
|
||||||
"Armenian": "hye",
|
|
||||||
"Armenian script": "Armenian",
|
"Armenian script": "Armenian",
|
||||||
"Assamese": "asm",
|
|
||||||
"Azerbaijani": "aze",
|
|
||||||
"Azerbaijani (Cyrillic)": "aze_cyrl",
|
|
||||||
"Basque": "eus",
|
|
||||||
"Belarusian": "bel",
|
|
||||||
"Bengali": "ben",
|
|
||||||
"Bengali script": "Bengali",
|
"Bengali script": "Bengali",
|
||||||
"Bosnian": "bos",
|
|
||||||
"Breton": "bre",
|
|
||||||
"Bulgarian": "bul",
|
|
||||||
"Burmese": "mya",
|
|
||||||
"Canadian Aboriginal script": "Canadian_Aboriginal",
|
"Canadian Aboriginal script": "Canadian_Aboriginal",
|
||||||
"Catalan": "cat",
|
|
||||||
"Cebuano": "ceb",
|
|
||||||
"Cherokee": "chr",
|
|
||||||
"Cherokee script": "Cherokee",
|
"Cherokee script": "Cherokee",
|
||||||
"Chinese - Simplified": "chi_sim",
|
|
||||||
"Chinese - Simplified (vertical)": "chi_sim_vert",
|
|
||||||
"Chinese - Traditional": "chi_tra",
|
|
||||||
"Chinese - Traditional (vertical)": "chi_tra_vert",
|
|
||||||
"Corsican": "cos",
|
|
||||||
"Croatian": "hrv",
|
|
||||||
"Cyrillic script": "Cyrillic",
|
"Cyrillic script": "Cyrillic",
|
||||||
"Czech": "ces",
|
|
||||||
"Danish": "dan",
|
|
||||||
"Devanagari script": "Devanagari",
|
"Devanagari script": "Devanagari",
|
||||||
"Divehi": "div",
|
|
||||||
"Dutch": "nld",
|
|
||||||
"Dzongkha": "dzo",
|
|
||||||
"English": "eng",
|
|
||||||
"English, Middle (1100-1500)": "enm",
|
|
||||||
"Esperanto": "epo",
|
|
||||||
"Estonian": "est",
|
|
||||||
"Ethiopic script": "Ethiopic",
|
"Ethiopic script": "Ethiopic",
|
||||||
"Faroese": "fao",
|
|
||||||
"Filipino": "fil",
|
|
||||||
"Finnish": "fin",
|
|
||||||
"Fraktur script": "Fraktur",
|
"Fraktur script": "Fraktur",
|
||||||
"Frankish": "frk",
|
|
||||||
"French": "fra",
|
|
||||||
"French, Middle (ca.1400-1600)": "frm",
|
|
||||||
"Frisian (Western)": "fry",
|
|
||||||
"Gaelic (Scots)": "gla",
|
|
||||||
"Galician": "glg",
|
|
||||||
"Georgian": "kat",
|
|
||||||
"Georgian script": "Georgian",
|
"Georgian script": "Georgian",
|
||||||
"German": "deu",
|
|
||||||
"Greek": "ell",
|
|
||||||
"Greek script": "Greek",
|
"Greek script": "Greek",
|
||||||
"Gujarati": "guj",
|
|
||||||
"Gujarati script": "Gujarati",
|
"Gujarati script": "Gujarati",
|
||||||
"Gurmukhi script": "Gurmukhi",
|
"Gurmukhi script": "Gurmukhi",
|
||||||
"Hangul script": "Hangul",
|
|
||||||
"Hangul (vertical) script": "Hangul_vert",
|
|
||||||
"Han - Simplified script": "HanS",
|
"Han - Simplified script": "HanS",
|
||||||
"Han - Simplified (vertical) script": "HanS_vert",
|
"Han - Simplified (vertical) script": "HanS_vert",
|
||||||
"Han - Traditional script": "HanT",
|
"Han - Traditional script": "HanT",
|
||||||
"Han - Traditional (vertical) script": "HanT_vert",
|
"Han - Traditional (vertical) script": "HanT_vert",
|
||||||
|
"Hangul script": "Hangul",
|
||||||
|
"Hangul (vertical) script": "Hangul_vert",
|
||||||
|
"Hebrew script": "Hebrew",
|
||||||
|
"Japanese script": "Japanese",
|
||||||
|
"Japanese (vertical) script": "Japanese_vert",
|
||||||
|
"Kannada script": "Kannada",
|
||||||
|
"Khmer script": "Khmer",
|
||||||
|
"Lao script": "Lao",
|
||||||
|
"Latin script": "Latin",
|
||||||
|
"Malayalam script": "Malayalam",
|
||||||
|
"Myanmar script": "Myanmar",
|
||||||
|
"Oriya (Odia) script": "Oriya",
|
||||||
|
"Sinhala script": "Sinhala",
|
||||||
|
"Syriac script": "Syriac",
|
||||||
|
"Tamil script": "Tamil",
|
||||||
|
"Telugu script": "Telugu",
|
||||||
|
"Thaana script": "Thaana",
|
||||||
|
"Thai script": "Thai",
|
||||||
|
"Tibetan script": "Tibetan",
|
||||||
|
"Vietnamese script": "Vietnamese",
|
||||||
|
"Amharic": "amh",
|
||||||
|
"Afrikaans": "arf",
|
||||||
|
"Arabic": "ara",
|
||||||
|
"Assamese": "asm",
|
||||||
|
"Azerbaijani": "aze",
|
||||||
|
"Azerbaijani (Cyrillic)": "aze_cyrl",
|
||||||
|
"Belarusian": "bel",
|
||||||
|
"Bengali": "ben",
|
||||||
|
"Tibetan Standard": "bod",
|
||||||
|
"Bosnian": "bos",
|
||||||
|
"Breton": "bre",
|
||||||
|
"Bulgarian": "bul",
|
||||||
|
"Catalan": "cat",
|
||||||
|
"Cebuano": "ceb",
|
||||||
|
"Czech": "ces",
|
||||||
|
"Chinese - Simplified": "chi_sim",
|
||||||
|
"Chinese - Simplified (vertical)": "chi_sim_vert",
|
||||||
|
"Chinese - Traditional": "chi_tra",
|
||||||
|
"Chinese - Traditional (vertical)": "chi_tra_vert",
|
||||||
|
"Cherokee": "chr",
|
||||||
|
"Corsican": "cos",
|
||||||
|
"Welsh": "cym",
|
||||||
|
"Danish": "dan",
|
||||||
|
"German": "deu",
|
||||||
|
"Divehi": "div",
|
||||||
|
"Dzongkha": "dzo",
|
||||||
|
"Greek": "ell",
|
||||||
|
"English": "eng",
|
||||||
|
"English, Middle (1100-1500)": "enm",
|
||||||
|
"Esperanto": "epo",
|
||||||
|
"Estonian": "est",
|
||||||
|
"Basque": "eus",
|
||||||
|
"Faroese": "fao",
|
||||||
|
"Persian": "fas",
|
||||||
|
"Filipino": "fil",
|
||||||
|
"Finnish": "fin",
|
||||||
|
"French": "fra",
|
||||||
|
"Frankish": "frk",
|
||||||
|
"French, Middle (ca.1400-1600)": "frm",
|
||||||
|
"Frisian (Western)": "fry",
|
||||||
|
"Gaelic (Scots)": "gla",
|
||||||
|
"Irish": "gle",
|
||||||
|
"Galician": "glg",
|
||||||
|
"Gujarati": "guj",
|
||||||
"Hatian": "hat",
|
"Hatian": "hat",
|
||||||
"Hebrew": "heb",
|
"Hebrew": "heb",
|
||||||
"Hebrew script": "Hebrew",
|
|
||||||
"Hindi": "hin",
|
"Hindi": "hin",
|
||||||
|
"Croatian": "hrv",
|
||||||
"Hungarian": "hun",
|
"Hungarian": "hun",
|
||||||
"Icelandic": "isl",
|
"Armenian": "hye",
|
||||||
"Indonesian": "ind",
|
|
||||||
"Inuktitut": "iku",
|
"Inuktitut": "iku",
|
||||||
"Irish": "gle",
|
"Indonesian": "ind",
|
||||||
|
"Icelandic": "isl",
|
||||||
"Italian": "ita",
|
"Italian": "ita",
|
||||||
"Italian - Old": "ita_old",
|
"Italian - Old": "ita_old",
|
||||||
"Japanese": "jpn",
|
|
||||||
"Japanese script": "Japanese",
|
|
||||||
"Japanese (vertical)": "jpn_vert",
|
|
||||||
"Japanese (vertical) script": "Japanese_vert",
|
|
||||||
"Javanese": "jav",
|
"Javanese": "jav",
|
||||||
|
"Japanese": "jpn",
|
||||||
|
"Japanese (vertical)": "jpn_vert",
|
||||||
"Kannada": "kan",
|
"Kannada": "kan",
|
||||||
"Kannada script": "Kannada",
|
"Georgian": "kat",
|
||||||
|
"Old Georgian": "kat_old",
|
||||||
"Kazakh": "kaz",
|
"Kazakh": "kaz",
|
||||||
"Khmer": "khm",
|
"Khmer": "khm",
|
||||||
"Khmer script": "Khmer",
|
"Kyrgyz": "kir",
|
||||||
"Korean": "kor",
|
"Korean": "kor",
|
||||||
"Korean (vertical)": "kor_vert",
|
"Korean (vertical)": "kor_vert",
|
||||||
"Kurdish (Arabic)": "kur_ara",
|
"Kurdish (Arabic)": "kur_ara",
|
||||||
"Kyrgyz": "kir",
|
|
||||||
"Lao": "lao",
|
"Lao": "lao",
|
||||||
"Lao script": "Lao",
|
|
||||||
"Latin": "lat",
|
"Latin": "lat",
|
||||||
"Latin script": "Latin",
|
|
||||||
"Latvian": "lav",
|
"Latvian": "lav",
|
||||||
"Lithuanian": "lit",
|
"Lithuanian": "lit",
|
||||||
"Luxembourgish": "ltz",
|
"Luxembourgish": "ltz",
|
||||||
"Macedonian": "mkd",
|
|
||||||
"Malayalam": "mal",
|
"Malayalam": "mal",
|
||||||
"Malayalam script": "Malayalam",
|
|
||||||
"Malay": "msa",
|
|
||||||
"Maltese": "mlt",
|
|
||||||
"Maori": "mri",
|
|
||||||
"Marathi": "mar",
|
"Marathi": "mar",
|
||||||
|
"Macedonian": "mkd",
|
||||||
|
"Maltese": "mlt",
|
||||||
"Mongolian": "mon",
|
"Mongolian": "mon",
|
||||||
"Myanmar script": "Myanmar",
|
"Maori": "mri",
|
||||||
|
"Malay": "msa",
|
||||||
|
"Burmese": "mya",
|
||||||
"Nepali": "nep",
|
"Nepali": "nep",
|
||||||
|
"Dutch": "nld",
|
||||||
"Norwegian": "nor",
|
"Norwegian": "nor",
|
||||||
"Occitan (post 1500)": "oci",
|
"Occitan (post 1500)": "oci",
|
||||||
"Old Georgian": "kat_old",
|
|
||||||
"Oriya (Odia) script": "Oriya",
|
|
||||||
"Oriya": "ori",
|
"Oriya": "ori",
|
||||||
"Pashto": "pus",
|
"script and orientation": "osd",
|
||||||
"Persian": "fas",
|
"Punjabi": "pan",
|
||||||
"Polish": "pol",
|
"Polish": "pol",
|
||||||
"Portuguese": "por",
|
"Portuguese": "por",
|
||||||
"Punjabi": "pan",
|
"Pashto": "pus",
|
||||||
"Quechua": "que",
|
"Quechua": "que",
|
||||||
"Romanian": "ron",
|
"Romanian": "ron",
|
||||||
"Russian": "rus",
|
"Russian": "rus",
|
||||||
"Sanskrit": "san",
|
"Sanskrit": "san",
|
||||||
"script and orientation": "osd",
|
|
||||||
"Serbian (Latin)": "srp_latn",
|
|
||||||
"Serbian": "srp",
|
|
||||||
"Sindhi": "snd",
|
|
||||||
"Sinhala script": "Sinhala",
|
|
||||||
"Sinhala": "sin",
|
"Sinhala": "sin",
|
||||||
"Slovakian": "slk",
|
"Slovakian": "slk",
|
||||||
"Slovenian": "slv",
|
"Slovenian": "slv",
|
||||||
"Spanish, Castilian - Old": "spa_old",
|
"Sindhi": "snd",
|
||||||
"Spanish": "spa",
|
"Spanish": "spa",
|
||||||
|
"Spanish": "spa_old",
|
||||||
|
"Albanian": "sqi",
|
||||||
|
"Serbian": "srp",
|
||||||
|
"Serbian (Latin)": "srp_latn",
|
||||||
"Sundanese": "sun",
|
"Sundanese": "sun",
|
||||||
"Swahili": "swa",
|
"Swahili": "swa",
|
||||||
"Swedish": "swe",
|
"Swedish": "swe",
|
||||||
"Syriac script": "Syriac",
|
|
||||||
"Syriac": "syr",
|
"Syriac": "syr",
|
||||||
"Tajik": "tgk",
|
|
||||||
"Tamil script": "Tamil",
|
|
||||||
"Tamil": "tam",
|
"Tamil": "tam",
|
||||||
"Tatar": "tat",
|
"Tatar": "tat",
|
||||||
"Telugu script": "Telugu",
|
|
||||||
"Telugu": "tel",
|
"Telugu": "tel",
|
||||||
"Thaana script": "Thaana",
|
"Tajik": "tgk",
|
||||||
"Thai script": "Thai",
|
|
||||||
"Thai": "tha",
|
"Thai": "tha",
|
||||||
"Tibetan script": "Tibetan",
|
|
||||||
"Tibetan Standard": "bod",
|
|
||||||
"Tigrinya": "tir",
|
"Tigrinya": "tir",
|
||||||
"Tonga": "ton",
|
"Tonga": "ton",
|
||||||
"Turkish": "tur",
|
"Turkish": "tur",
|
||||||
|
"Uyghur": "uig",
|
||||||
"Ukrainian": "ukr",
|
"Ukrainian": "ukr",
|
||||||
"Urdu": "urd",
|
"Urdu": "urd",
|
||||||
"Uyghur": "uig",
|
|
||||||
"Uzbek (Cyrillic)": "uzb_cyrl",
|
|
||||||
"Uzbek": "uzb",
|
"Uzbek": "uzb",
|
||||||
"Vietnamese script": "Vietnamese",
|
"Uzbek (Cyrillic)": "uzb_cyrl",
|
||||||
"Vietnamese": "vie",
|
"Vietnamese": "vie",
|
||||||
"Welsh": "cym",
|
|
||||||
"Yiddish": "yid",
|
"Yiddish": "yid",
|
||||||
"Yoruba": "yor"
|
"yor": "Yoruba"
|
||||||
}
|
}
|
Loading…
Reference in a new issue