{"id":23965,"date":"2026-04-20T20:12:40","date_gmt":"2026-04-20T18:12:40","guid":{"rendered":"https:\/\/distam.hypotheses.org\/?p=23965"},"modified":"2026-04-20T20:16:34","modified_gmt":"2026-04-20T18:16:34","slug":"chi-know-po-chinese-knowledge-and-poetry-in-medieval-china","status":"publish","type":"post","link":"https:\/\/distam.hypotheses.org\/23965","title":{"rendered":"CHI-KNOW-PO &#8211; Chinese Knowledge and Poetry in Medieval China"},"content":{"rendered":"\n<p><em>Ce billet pr\u00e9sente bri\u00e8vement un des projets-c\u0153urs du consortium distam+. <\/em><\/p>\n\n\n\n<h3 class=\"wp-block-heading\">R\u00e9sum\u00e9<\/h3>\n\n\n\n<p>Le projet CHI-KNOW PO est port\u00e9 par <a href=\"https:\/\/cv.hal.science\/marie-bizais\" target=\"_blank\" rel=\"noreferrer noopener\">Marie Bizais-Lillig<\/a> \u00e0 l&#8217;<a href=\"https:\/\/www.usias.fr\/fellows\/fellows-2021\/marie-bizais-lillig\/#c112437\" target=\"_blank\" rel=\"noreferrer noopener\">Universit\u00e9 de Strasbourg<\/a>. Ce projet vise \u00e0 documenter les pratiques textuelles dans la culture lettr\u00e9e de la deuxi\u00e8me moiti\u00e9 du premier mill\u00e9naire en Chine sachant que les lettr\u00e9s, qui remplissent des fonctions administratives et militaires au sein de l&#8217;empire, sont les auteurs de po\u00e8mes, de d\u00e9crets, d\u2019archives historiques, d\u2019essais, ou encore d\u2019ouvrages techniques. L\u2019\u00e9tude d\u2019un corpus h\u00e9t\u00e9rog\u00e8ne m\u00ealant ces diff\u00e9rents genres d\u2019\u00e9crits devrait permettre de comprendre comment les savoirs circulent et si des savoirs sp\u00e9cifiques (sur les plantes par exemple) apparaissent dans des genres diff\u00e9rents.<\/p>\n\n\n\n<p>Le projet se compose de trois volets :<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Constitution d&#8217;un corpus<\/strong> de textes compos\u00e9s pour l&#8217;essentiel pendant le premier mill\u00e9naire en Chine. Cette \u00e9tape s&#8217;appuie, en amont, sur le d\u00e9veloppement de technologies de reconnaissance des textes sur les pages d&#8217;ouvrages anciens conserv\u00e9s dans des biblioth\u00e8ques. Le partage sous licence ouverte des images des livres et d&#8217;une \u00e9dition structur\u00e9e des textes s&#8217;accompagne d&#8217;une publication en ligne du corpus afin d&#8217;assurant tant sa r\u00e9utilisabilit\u00e9 que son accessibilit\u00e9.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>D\u00e9veloppement d&#8217;une base de donn\u00e9es bio-biblio-lexicographique<\/strong> servant \u00e0 documenter le corpus et les termes utilis\u00e9s (les champs lexicaux de la faune, la flore, les ph\u00e9nom\u00e8nes naturels et les sentiments et \u00e9motions en particulier). Cette base de connaissances compl\u00e8te les bases de donn\u00e9es d\u00e9j\u00e0 existantes. Elle permet d&#8217;enrichir le corpus lors du processus d&#8217;\u00e9dition en XML-TEI. Elle contribue aussi \u00e0 affiner l&#8217;exploration du corpus.<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>D\u00e9veloppement de scripts de fouille de texte<\/strong> afin de r\u00e9pondre \u00e0 des questions de recherche&nbsp;:\n<ul class=\"wp-block-list\">\n<li>quels sont les textes les plus cit\u00e9s ou les plus repris \u00e0 une p\u00e9riode donn\u00e9e&nbsp;?<\/li>\n\n\n\n<li>comment \u00e9voluent certaines formes de discours, comme le discours argumentatif ou le vocabulaire po\u00e9tique par exemple&nbsp;?<\/li>\n\n\n\n<li>dans quelle mesure les grands domaines de savoir se rencontrent-ils dans les \u00e9crits&nbsp;?<\/li>\n\n\n\n<li>dans quelle mesure la po\u00e9sie contribue-t-elle \u00e0 la circulation des savoirs, \u00e0 commencer par les savoirs \u2014 agricoles ou m\u00e9dicinaux \u2014 sur les plantes&nbsp;?<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n\n\n\n<p>Les deux premiers volets de ce projet ont \u00e9t\u00e9 mis en \u0153uvre entre 2020 et 2025 (GEO, <a href=\"https:\/\/www.usias.fr\/fellows\/fellows-2021\/marie-bizais-lillig\/\">USIAS<\/a>, <a href=\"https:\/\/www.collexpersee.eu\/projet\/chi-know-po-corpus\/\">Collex-Pers\u00e9e<\/a>, distam) et constituent le socle du troisi\u00e8me volet qui concentre l\u2019essentiel de l\u2019int\u00e9r\u00eat scientifique pour la communaut\u00e9 des sinologues.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">En savoir plus sur les \u00e9tapes pr\u00e9c\u00e9dentes et les r\u00e9alisations associ\u00e9es :<\/h4>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Les donn\u00e9es d&#8217;entra\u00eenement pour l&#8217;ATR : <a href=\"https:\/\/zenodo.org\/records\/14452717\">sur Zenodo<\/a>, <a href=\"https:\/\/huggingface.co\/datasets\/calfa-ai\/chiknowpo\">sur Hugging Face<\/a><\/li>\n\n\n\n<li>La base de donn\u00e9es : <a href=\"https:\/\/distam.hypotheses.org\/4693\">une pr\u00e9sentation<\/a>, <a href=\"https:\/\/gitlab.huma-num.fr\/chi-know-po\/knowledge-base\">les donn\u00e9es<\/a>, <a href=\"https:\/\/gitlab.huma-num.fr\/chi-know-po\/tools\">une interface de requ\u00eatage<\/a><\/li>\n\n\n\n<li>La documentation du projet (et <a href=\"https:\/\/gitlab.huma-num.fr\/chi-know-po\">ses outils<\/a>) : <a href=\"https:\/\/chi-know-po.gitpages.huma-num.fr\/\">dans le d\u00e9p\u00f4t GitLab<\/a><\/li>\n\n\n\n<li>La biblioth\u00e8que m\u00e9di\u00e9vale chinoise en ligne : <a href=\"https:\/\/estrades-app4.huma-num.fr\/chiknowpo\/en\/corpus.html\" target=\"_blank\" rel=\"noreferrer noopener\">Chinese Knowledge and Poetry Medieval Library<\/a><\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Objectifs<\/h3>\n\n\n\n<h4 class=\"wp-block-heading\">Apports scientifiques :<\/h4>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Proposer des analyses du discours lettr\u00e9 de la Chine du premier mill\u00e9naire sur la base de larges corpus (et non des \u00e9tudes de cas qui pourraient \u00eatre des cas relativement isol\u00e9s)<\/li>\n\n\n\n<li>Enrichir l\u2019histoire intellectuelle de la Chine du premier mill\u00e9naire<\/li>\n\n\n\n<li>Contribuer \u00e0 la r\u00e9flexion sur les impacts du recrutement des lettr\u00e9s fonctionnaires par voie de concours sur l\u2019\u00e9ducation, la circulation des textes et la sp\u00e9cialisation des lettr\u00e9s<\/li>\n<\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Innovation : <\/h4>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Affinage de mod\u00e8les de langue (SikuBERT et autres d\u00e9riv\u00e9s de BERT notamment, LLM si besoin) pour les appliquer aux textes (prose, po\u00e9sie, si besoin des genres sp\u00e9cifiques) de la Chine du premier mill\u00e9naire<\/li>\n\n\n\n<li>Tests de RAG sur des pans du corpus<\/li>\n\n\n\n<li>Exploration des collocations et tests de topic modelling<\/li>\n\n\n\n<li>Visualisations sous la forme de r\u00e9seaux s\u00e9mantiques<\/li>\n<\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Jeux de donn\u00e9es :<\/h4>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Corpus en XML-TEI (largement constitu\u00e9, encore en cours pour les encyclop\u00e9dies et dictionnaires)<\/li>\n\n\n\n<li>Base de donn\u00e9es bio-bibliographique et lexicale<\/li>\n<\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Domaines dans distam+ :<\/h4>\n\n\n\n<ul class=\"wp-block-list\">\n<li>acquisition, mod\u00e9lisation et partage<\/li>\n\n\n\n<li>philologie multimodale<\/li>\n<\/ul>\n\n\n\n<h4 class=\"wp-block-heading\">Mots clefs :<\/h4>\n\n\n\n<p>Culture lettr\u00e9e, Chine du premier mill\u00e9naire, ATR, \u00c9dition en XML-TEI, Text mining<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Personnes r\u00e9f\u00e9rentes et institution de rattachement :<\/h4>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/cv.hal.science\/marie-bizais\" target=\"_blank\" rel=\"noreferrer noopener\">Marie Bizais-Lillig<\/a> (Universit\u00e9 de Strasbourg)<\/li>\n<\/ul>\n\n\n\n<p><em>Banni\u00e8re: <\/em>Reprise s\u00e9quentielle de texte visualis\u00e9e avec l&#8217;Overlap Tracker du projet CHI-KNOW-PO<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ce billet pr\u00e9sente bri\u00e8vement un des projets-c\u0153urs du consortium distam+. R\u00e9sum\u00e9 Le projet CHI-KNOW PO est port\u00e9 par Marie Bizais-Lillig \u00e0 l&#8217;Universit\u00e9 de Strasbourg. Ce projet vise \u00e0 documenter les pratiques textuelles dans la culture lettr\u00e9e de la deuxi\u00e8me moiti\u00e9 du premier mill\u00e9naire en Chine sachant que les lettr\u00e9s, qui&#46;&#46;&#46;<\/p>\n","protected":false},"author":91828,"featured_media":25172,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_license":"","footnotes":""},"categories":[680],"tags":[290,91,474,338,259],"ppma_author":[679],"class_list":["post-23965","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-projets-coeurs","tag-annotation","tag-asie","tag-base-de-donnees","tag-llm","tag-xml-tei"],"authors":[{"term_id":679,"user_id":91828,"is_guest":0,"slug":"nlucas","display_name":"nlucas","avatar_url":"https:\/\/secure.gravatar.com\/avatar\/fcab1b2b5af9056149ab598a911a89a822e7452194c917c9f81d4338b59d4296?s=96&d=blank&r=g","1":"","2":"","3":"","4":"","5":"","6":"","7":"","8":""}],"_links":{"self":[{"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/posts\/23965","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/users\/91828"}],"replies":[{"embeddable":true,"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/comments?post=23965"}],"version-history":[{"count":10,"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/posts\/23965\/revisions"}],"predecessor-version":[{"id":25175,"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/posts\/23965\/revisions\/25175"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/media\/25172"}],"wp:attachment":[{"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/media?parent=23965"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/categories?post=23965"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/tags?post=23965"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/distam.hypotheses.org\/wp-json\/wp\/v2\/ppma_author?post=23965"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}