16/01/2026
Korpus má novou vlajkovou loď! ⛵️
Jednou za pět let vydáváme nový 100milionový žánrově vyvážený korpus psaného jazyka – po SYN2000, SYN2005, SYN2010, SYN2015 a SYN2020 nadešel čas na SYN2025! Jako vždy obsahuje úplně nové texty, je líp anotován, lemmatizován a značkován. Tak si ho užijte...
cnk:syn2025 - Příručka ČNK
Korpus SYN2025 je synchronní reprezentativní a referenční korpus současné psané češtiny, obsahující 100 milionů textových slov, tedy včetně interpunkce (tokenů). Navazuje na předchozí korpusy řady SYN (SYN2000, SYN2005, SYN2010, SYN2015 a SYN2020), vydávané v pětiletých interv...
12/09/2025
⏳ Už jen do neděle 14. září se můžete přihlásit do programu s mikrocertifikátem Základy digital humanities. 💻📚
👏 „V červnu 2024 jsem absolvovala kurz Základy digital humanities, který nastartoval změnu mojí kariéry a nasměroval mě na datovou analýzu. Nyní, v srpnu 2025, už mám svůj první IT job,“ říká absolventka kurzu a datová analytička Eliška Špilarová.
💡 Kurz je určen nejen studujícím UK, ale i veřejnosti v rámci celoživotního vzdělávání. Vhodný je pro archiváře, žurnalisty, editory, tiskové mluvčí, datové analytiky, IT specialisty a všechny, kdo pracují s digitálními texty.
👉 Více informací a přihlášku najdete na: https://www.ff.cuni.cz/prijimaci-rizeni/programy-mikrocertifikatem/.
06/06/2025
Právě vyšel Orátor 3, což není sequel blockbusteru o superhrdinovi s nadpřirozenými řečnickými schopnostmi, ale korpus připravených monologů. V této verzi máte k dispozici 1,5 mil. slov z téměř 500 nahrávek, které jsou pro lepší vyhledávání anotovány stejným způsobem jako korpusy řady SYN. Více viz https://wiki.korpus.cz/doku.php/cnk:orator
12/05/2025
Zveřejnili jsme další verzi hostovaného korpusu EEBO (Early English Books Online), která oproti té původní přináší téměř dvojnásobný rozsah a také lingvistickou anotaci (standardizaci, lemmatizaci a slovnědruhové značkování) významně usnadňující jeho použití.
We released a new version of the hosted EEBO (Early English Books Online) corpus. Compared to its predecessor, EEBO v2 is almost twice as large and brings also linguistic annotation (regularisation, lemmatisation and POS tagging) that makes its use much easier.
More info:
en:cnk:eebo - Příručka ČNK
The EEBO version 1 corpus contains more than 25 000 English texts from the period 1475–1700, which were digitalized by the Text Creation Partnership organization during Phase 1 of the Early English Books Online project; a detailed description of the digitalization process is available here. Overal...
05/02/2025
Mapka je už i ve Slovenském národním korpusu. Českou najdete zde: https://www.korpus.cz/mapka/
🤨 Čo vám zíde na um ako prvé pri slove mapka?
🤔 Mapka sveta či Slovenska? A ak mapka Slovenska, tak aká mapa?
🫡 Zišla vám na um aj mapa nárečí?
🗺 Predstavujeme vám interaktívnu aplikáciu Mapka, ktorá prináša nárečové nahrávky z rôznych lokalít Slovenska na mape. Viete, do akého nárečového areálu patrí vaša obec či mesto? Neváhajte a zistite nielen to.
ℹ️ Aplikáciu pripravuje oddelenie Slovenský národný korpus Jazykovedného ústavu Ľ. Štúra SAV, v. v. i., v spolupráci s odborníkmi na slovenské nárečia.
👉 Aplikáciu Mapka nájdete aj s ďalšími informáciami o nej na: https://mapka.korpus.sk
09/10/2024
💬 „V 90. letech se s rozvojem počítačů začaly ve světě etablovat korpusy a spolu s tím se začala rozvíjet empirická lingvistika, která zkoumá jazyk na základě dat. Česká republika se k této vlně připojila,“ říká o výročí v novém článku Forum: magazín Univerzity Karlovy dr. Michal Křen z Český národní korpus.
https://www.ukforum.cz/rubriky/academia/9420-unikatni-databaze-cestiny-slavi-vznikat-zacala-pred-30-roky 📎
02/10/2024
👨💻 ,,Jsme první na světě, kdo přinesl do lingvistiky propojení jazykového korpusu s umělou inteligencí," říká dr. Jiří Milička z Český národní korpus ve Studiu 6. Propojení Českého národního korpusu s Chatem GPT si můžete vyzkoušet přímo v Chatu GPT v modulu Corpus Linguist a povídat si s ní podobně jako v této ukázce: https://www.youtube.com/watch?v=ucG9aJQxlus.
💬 Více se o dozvíte na:
https://www.ceskatelevize.cz/porady/10441287766-studio-6-vikend/224411010120928/ (37. minuta).
20/09/2024
🗣 Český národní korpus, který systematicky mapuje vývoj naší rodné řeči už 30 let, se nyní propojí s umělou inteligencí. Jak nám to pomůže? K čemu korpus vlastně je? Jak reflektuje proměny češtiny? A jak se to projevuje ve výuce? Saša Michailidis se ptá v pořadu Akcent Český rozhlas Vltava lingvisty Jiřího Miličky.
https://1url.cz/ 👀
18/09/2024
Jiří Milička o 30 letech korpusu a o propojení s AI.
Korpus češtiny si zahrává s AI, ale taky usnadňuje výuku cizinců
Saša Michailidis se ptá lingvisty Jiřího Miličky z Ústavu českého národního korpusu FF UK a učitelky Terezy Binderové ze ZŠ Grafická na pražském Smíchově. Český národní korpus, který systematicky mapuje vývoj naší rodné řeči už třicet let, se nyní propojí s umělou i...
10/09/2024
Oslavy 30 let minulosti korpusu máme za sebou a v tomhle videu vám Jiří Milička ukáže, jak vypadá budoucnost práce s korpusem.
Video je povinnost zejména pro ty, kteří bojují se zadáváním dotazu, změní vám to život.
Narozeniny
09/09/2024
K výročí 30 let Českého národního korpusu jsme si pro vás připravili pár střípků z našeho archívu. Pamětníci se můžou podělit o svoje zkušenosti v komentáři.
A pokud jste ještě dneska nebyli na www.korpus.cz tak si honem běžte ulovit balónek, dokud jsou.
09/09/2024
🎂 Český národní korpus slaví 30. výročí svého založení! Akademický projekt FF UK, který byl založený 9. září 1994, má za cíl systematicky mapovat češtinu a další jazyky ve srovnání s ní. V současné době zajišťuje přístup k více než třem miliardám slov uspořádaných v tzv. korpusech.
👉 Zajímá vás víc? Sledujte naše sociální sítě a další informace se dočtete také na webu: https://www.ff.cuni.cz/2024/09/cesky-narodni-korpus-slavi-30-vyroci-sveho-zalozeni/.