Papers by Daniel Pimienta

International review of information ethics, Nov 29, 2022
The methodology, sources, biases and results of the recent study of the Observatory of Linguistic... more The methodology, sources, biases and results of the recent study of the Observatory of Linguistic and Cultural Diversity on the Internet, for the creation of indicators of the presence on the Internet of the 330 languages with more than one million L1 speakers, are presented. It appears that the languages of Europe, and especially English, are still dominating the Internet but that the languages of Asia and the Arabic world are in a strong progression and will take the lead, first in terms of connected speakers (part 2 develops this point). The case of English is focused to demonstrate that its share of the Internet keeps declining to reach now 25%, despite some kind of mediatic disinformation placing it above 50% by trusting sources that do not pay due attention to multilingualism. The lingua franca of the Internet is translation, the indispensable crutch of multilingualism.

International review of information ethics, Nov 29, 2022
Part 1 of this study explains the methodology, sources, biases, and results of the recent study o... more Part 1 of this study explains the methodology, sources, biases, and results of the recent study on the presence on the Internet of the 330 languages with more than one million L1 speakers, and the reality of the place of English on the Internet. This part analyzes the results in terms of cyber-geography for the other languages. It appears that the languages of Europe, especially English, are still dominating the Internet but that the languages of Asia and the Arabic world are in a strong progression and will take the lead, in terms of connected speakers. The languages of Africa are suffering from the difficulty of many African countries to overcome the digital divide: however, demographic long-term future clearly will favor in the long run African languages and the European languages with a notable presence in Africa (by order of importance: English, French and Portuguese).

"njeux de mots, livre collectif rédigé par une trentaine d'auteurs issus de la société ... more "njeux de mots, livre collectif rédigé par une trentaine d'auteurs issus de la société civile et venus de quatre continents, propose un décryptage des grandes notions de la « société de l'information ». Sociétés de l'information et sociétés de la connaissance, Gouvernance en réseau et gouvernance électronique, Gouvernance de l'internet, Diversité culturelle, Infrastructure et accès universel, Fracture numérique, Accès public à l'internet, Femmes, Accessibilité, Intelligence coopérative, Expression citoyenne, Innovation par l'usage, Communautés virtuelles, Bibliothèques numériques, Gestion des savoirs, Education, Droits humains, Cybercriminalité, Droits de la communication, Médias, Piraterie, Logiciel libre, Droits de propriété intellectuelle, Économie de l'information 24 thèmes pour mieux comprendre les enjeux des Sociétés de l'information"

Frontiers in Research Metrics and Analytics
Reliable and updated indicators of the presence of languages in the Internet are required to driv... more Reliable and updated indicators of the presence of languages in the Internet are required to drive efficiently policies for languages, to forecast e-commerce market or to support further researches on the field of digital support of languages. This article presents a complete description of the methodological elements involved in the production of an unprecedented set of indicators of the presence in the Internet of the 329 languages with more than 1 million L1 speakers. A special emphasis is given to the treatment of the comprehensive set of biases involved in the process, either from the method or the various sources used in the modeling process. The biases related to other sources providing similar data are also discussed, and in particular, it is shown how the lack of consideration of the high level of multilingualism of the Web leads to a huge overestimation of the presence of English. The detailed list of sources is presented in the various annexes. For the first time in the h...

Michel EGGER, Gastredaktor Die technizistischen und evolutionistischen Diskurse der Weltbank, der... more Michel EGGER, Gastredaktor Die technizistischen und evolutionistischen Diskurse der Weltbank, der grossen UN-Unterorganisationen und auch der Schweizerischen Bundesverwaltung beweisen es: Die Informations- uned Kommunikationstechnologien (IKT) – in erster Linie das Internet – haben sich von Instrumenten zur Überwindung von Zeit und Raum zu einer „neuen Grenze“ in der Entwicklungszusammenarbeit entwickelt. Einerseits stehen sie für die nach wie vor ungedeckten Bedürfnisse, die eine alarmierende Ungleichheit vor Augen führen, anderseits bilden sie ein Instrument zur Armutsbekämpfung. Was bleibt jedoch, nach der technologischen Faszination und den Schlagzeilen – Trugbild oder Wirklichkeit? Woher stammen modische Konzepte wie die „digitale Kluft“ und was steckt dahinter? Inwiefern haben die IKT die Ansätze in der Entwicklungszusammenarbeit verändert? Welchen Einfluss hat umgekehrt die Entwicklungszusammenarbeit auf Inhalte und Anwendung der Technologie? Stimmen die Massnahmen vor Ort mi...
Enjeux de mots: regards multiculturels sur les sociétés de l'information, 2005, ISBN 2-915825-03-3, págs. 35-45, 2005
Localizing the Internet, 2018

In a context of scarcity of reliable data about the space of languages in the Internet, the 2017 ... more In a context of scarcity of reliable data about the space of languages in the Internet, the 2017 alternative approach to compute indicators of behavior in the Internet, for the 140 languages with more than 5 million speakers, has been enhanced and actualized. The enhancements of this approach based on the collection of a series of micro-indicators that measure languages or countries in various Internet spaces or applications are exposed. The use of the last Ethnologue Global Data Set allows not only to dispose of the most reliable and up to date demo-linguistic data but also give the ground to overcome one of the major bias of the method related to the process of the L2 speakers. The five indicators of languages in the Internet which has been defined and exposed in 2017 (Internet users, traffic, use, contents, societal indexes and interfaces), and 4 macro-indicators which are deduced from them (power, capacity, gradient and content productivity) are reproduced with all inputs updated in 2021. The results are showing the trends with English decreasing close to 25% and Chinese getting stronger while Spanish is comforted in third position. French shares now the third place with Hindi, with a reduced advance over a group of languages in very close positions: Portuguese, Russian, Arabic and German. As in 2017 edition, all possible biases derived from the method, assumptions or sources are discussed and finally an estimate is proposed that consider those biases. It is forecasted for the end of 2021 a new set of enhancements with the high possibility to extend the results for the 332 languages with more than 1 million L1 speakers, a limit that this method shall not cross to avoid stronger biases.

En un contexto de escasez de datos fiables sobre el espacio lingüístico en la Internet, se enriqu... more En un contexto de escasez de datos fiables sobre el espacio lingüístico en la Internet, se enriqueció y actualizó el enfoque alternativo de 2017 para la producción de indicadores de comportamiento en la Internet de 140 lenguas con más de 5 millones de hablantes. Se presentan las mejoras de este enfoque, que se basa en la recopilación de una gran serie de micro-indicadores sobre lenguas o países en diversos espacios o aplicaciones de la Internet (o en relación a la Internet). La utilización de los últimos datos elaborados por Ethnologue permitió disponer de las cifras demo-lingüísticas más fiables y actualizadas y, además, aportar los elementos para superar uno de los principales sesgos del método, ligado al tratamiento de los hablantes de L2. Los seis indicadores de presencia de lenguas en la Internet definidos y estudiados en 2017 (internautas, tráfico, usos, contenidos, indexes e interfaces), y los cuatro macro-indicadores que se deducen de ellos (potencia, contenido capacidad, gradiente y productividad) se reproducen después de las actualizaciones para 2021 de todas las fuentes. Los resultados muestran una disminución relativa en la presencia del inglés, en torno al 25% (frente al 30% en 2017) y un claro aumento de la presencia del chino mientras que el español se consolida en la tercera posición. El francés comparte ahora el tercer lugar con el hindi con una ventaja reducida, en comparación con 2017, con un grupo de lenguas con pesos muy similares: portugués, ruso, árabe y alemán. Al igual que en la edición de 2017, todos los posibles sesgos derivados del método, hipótesis o fuentes se examinan y se propone una estimación que tiene en cuenta estos sesgos, para las principales lenguas. Está previsto un nuevo conjunto de mejoras para finales de 2021 con la posibilidad de ampliar los resultados para las 332 lenguas con más de 1 millón de hablantes L1.
Trabajo colectivo . Luis Germán Rodrígues coordinador general; Miguel Ángel Perez Alvarez coordin... more Trabajo colectivo . Luis Germán Rodrígues coordinador general; Miguel Ángel Perez Alvarez coordinador temático.
Latine and Member of Executive Committee of MAAYA network) and Àlvaro Blanco (Head of FUNREDES, S... more Latine and Member of Executive Committee of MAAYA network) and Àlvaro Blanco (Head of FUNREDES, Spain). Several other people from Union Latine and FUNREDES also participated in this project, including Marcelo Sztrum, who managed the team of linguists for the word-concepts selection, Benoit Lamey, who wrote the computer programme that has entailed limited human intervention in the measurement process, and Roger Price, who provided essential inputs to the statistical part of the research.
… , Ambrosi, Pimienta, éds, Enjeux de mots. …, 2005

Revista Ibero-Americana de Ciência da Informação, 2020
Partiendo de un análisis de las diferencias entre comunidades virtuales y redes sociales se desar... more Partiendo de un análisis de las diferencias entre comunidades virtuales y redes sociales se desarrolla una descripción crítica de cómo la Internet ha evolucionado en los últimos 20 años hacia una situación marcada por el fin del diálogo y la promoción obsesiva de las visiones centradas en intereses egocéntricos. Se identifica la singularidad histórica a partir de la cual se desencadenó esta situación en la decisión de Google, a inicio de los años 2000, de hacer de la publicidad el foco de su estrategia de negocio y de cómo transformó, con la ayuda de las otras Gigantes Tecnológicas, a los usuarios en usuarios-productos y luego en agentes de su propio mercadeo, mediante el uso de su egomación. Se indaga sobre el papel jugado por la sociedad civil especializada en los temas de sociedad global de la información, en donde ha presentado poca resistencia a los cambios surgidos en el camino. Además de representar un divorcio con las utopías iniciales compartidas, esta evolución es una amen...
Papers by Daniel Pimienta