0% encontró este documento útil (0 votos)
80 vistas35 páginas

01 Programming Intro

Este documento presenta una introducción a un curso de programación en Stata. Explica que el curso cubrirá temas como la organización de datos, limpieza de datos, construcción de datos y análisis de datos usando Stata. El objetivo es enseñar buenas prácticas de programación y conceptos estadísticos usando Stata, con énfasis en implementar programación básica y avanzada de manera eficiente. El curso consta de 5 sesiones sobre diferentes temas y utilizará materiales compartidos en Github.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
80 vistas35 páginas

01 Programming Intro

Este documento presenta una introducción a un curso de programación en Stata. Explica que el curso cubrirá temas como la organización de datos, limpieza de datos, construcción de datos y análisis de datos usando Stata. El objetivo es enseñar buenas prácticas de programación y conceptos estadísticos usando Stata, con énfasis en implementar programación básica y avanzada de manera eficiente. El curso consta de 5 sesiones sobre diferentes temas y utilizará materiales compartidos en Github.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Programación 101

Rony Rodriguez-Ramírez
July 3, 2020
The World Bank | DIME
LAMBDA
Introducción al Curso
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Introducción

¿Quién soy?

• Nombre: Rony Rodrigo Maximiliano Rodríguez-Ramírez


• Trabajo: Banco Mundial, Washington, D.C.
• Development Impact Evaluation Unit (DIME)
• Educación: Economista con máster en Development Policy (KDI School)
• Experiencia:
• Innovations for Poverty Action (IPA)
• KDI School of Public Policy and Management
• La mayoría de mi trabajo es evaluación de impacto de Randomized
Controlled Trials en países en desarrollo (e.g., Rwanda, Liberia, etc.).

2/30
Organización del Curso
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Enfoque del Curso

• ¿Por qué es importante aprender un software de análisis econométrico hoy


en día (Stata, R, etc.)?
• Mejoramiento del conocimiento de programación aplicada a la econometría
y la investigación.
• Buenas prácticas de programación de la Unidad de Evaluación de Impacto
del Banco Mundial.

3/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Objetivos

Objetivos del Curso:

• Aprender los conceptos clave y las técnicas econométricas asociadas a la


programación estadísticas usando Stata enfatizando la eficiencia de escribir
códigos:
• Desarrollar buenos hábitos de programación.
• Aprende a implementar programación básica y avanzada.
• Aprenda varias características y detalles específicos del lenguaje de
programación popular en econometría, Stata.

4/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Sesiones

Este curso estará dividio en 5 sesiones (o mejor dicho tópicos):

1. Programación 101 (2 horas)


2. Manejo y Limpieza de Datos (2 horas)
3. Construcción de Datos (2 horas)
4. Análisis de Datos (4 horas)
5. Programando modelos de evaluación de Impacto
5.1 RCTs y Datos Panel (2 horas)
5.2 Diferencias en Diferencias (2 horas)
5.3 Regresión Discontinua (2 horas)

5/30
Materiales del Curso
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Repositorio en Github

Los materiales del curso se pueden encontrar en el siguiente enlance enlace.


Este repositorio será actualizado semalmente con las siguietes carpetas. A su
vez, subiré la misma información al Canvas.

1. Lecturas (Slides)
• 01-programming-intro
• 02-manejo-limpieza-datos
2. Codes (Stata)
• 01-programming-intro
• 02-manejo-limpieza-datos
3. Syllabus

6/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Encuestas

• Uso de Stata
• Uso de Git
• Uso de LATEX

7/30
Programación 101
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Excel vs Stata

¿Puedo ocupar Excel para análisis de regresiones?

8/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

La principal razón por la cual escribimos códigos

• En Excel, se realiza cambios directamente en los datos y guarda nuevas


versiones del conjunto de datos.
• En Stata (o R), realiza cambios en las instrucciones sobre cómo pasar de los
datos sin procesar al análisis final y guarda nuevas versiones de las
instrucciones.
• En Stata utilizamos do files (or ado files).
• En R utilizamos RScripts.

9/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Tu código es un resultado

¿Cómo deberíamos de tratar nuestro código?


Los investigadores a menudo tratan el código como un medio para un fin, pero el
punto principal de esta presentación es que su código es tanto un fin en sí
mismo como el documento o el informe que está escribiendo.

10/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Objetivo de esta primera sesión

• Para convertirse en un gran coder, ambos deben codificar como un coder y


pensar como un coder.
• Ambos requieren mucha práctica para dominar, pero el objetivo de esta
sesión es brindarle un marco para pensar como un codificador
respondiendo preguntas como:
• ¿Por qué programar?
• ¿Cómo programo para que sea lo más útil para otras personas de mi equipo?

11/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Programar en academia vs workplace

• En academia:
• Estar en el correcto importa.
• Workplace:
• Estar en lo correcto es igual de importante que en la academia,
• Los miembros del equipo pasados, actuales y futuros contribuirán al mismo
código y, por lo tanto, debemos estandarizar cómo programamos y centrarnos
en las habilidades para programar como equipo.

12/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Pensamiento crítico sobre los datos.

• ¿Creo en este número?


• ¿Qué puede salir mal en mi código?
• ¿Cómo se tratarán los valores perdidos en este comando?
• ¿Qué pasaría si se agregaran más observaciones al conjunto de datos?
• ¿Qué sucedería si algunas observaciones se eliminaran del conjunto de
datos?

13/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Explore un conjunto de datos sin procesar

¿Qué es lo primero que buscamos cada vez que abre un nuevo conjunto de datos
por primera vez?

1. Unidad de observación.
2. Identificación completa y única de una variable ID.

14/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Explore a raw data set

• Household_data.csv

15/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Explore a raw data set

• Clinic_data.csv

16/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Variable ID

• Solo trabaje con un conjunto de datos que tenga una variable de ID. Si el
conjunto de datos que ha recibido no tiene uno, entonces crearlo es su
primera tarea.
• Probar que la variable ID es única y completamente identificable.
• Use solo una variable como variable de ID.

17/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

División de roles en el trabajo de datos

Asistentes de investigación

• Nadie mirará los datos tanto como el RA.


• Las irregularidades en los datos que la RA no identifica a menudo nunca se
descubrirán

Economistas

• A cargo de decidir qué irregularidades se corregirán y cómo.


• Los economistas dependen completamente de los RA para identificar
irregularidades y obtener la información para tomar la mejor decisión.

18/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Estilo

Stata no distingue entre un espacio vacío y muchos espacios vacíos, o un salto


de línea o muchos saltos de línea. Es una gran diferencia para el ojo humano y
nunca compartiríamos un documento de Word, una hoja de Excel o una
presentación de PowerPoint sin pensar en espacios en blanco, aunque en este
caso lo llamamos formato.

¿Es esta diapositiva fácil de leer?

19/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

White space - Espacio blanco

• Stata no distingue entre un espacio vacío y muchos espacios vacíos, o un


salto de línea o muchos saltos de línea.
• Es una gran diferencia para el ojo humano y nunca compartiríamos un
documento de Word, una hoja de Excel o una presentación de PowerPoint
sin pensar en espacios en blanco, aunque en este caso lo llamamos formato.

20/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Líneas verticales

21/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Líneas verticales

22/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Uso del archivos de ayuda y el conocimiento de programación

23/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Archivos de ayuda (help files)

• Escriba Stata: help nombre_comando


• ¡Acostúmbrate a usar el archivo de ayuda con la mayor frecuencia posible!
• Incluso con comandos familiares, siempre más para aprender.
• Los archivos de ayuda son solo resúmenes del manual de referencia
prácticas de codificación, errores comunes, enfoques alternativos.

24/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

¿Dónde están las regresiones

• Todavía no hemos realizado nada sobre regresiones.


• En programación, el análisis es la parte fácil siempre que el conjunto de
datos esté configurado correctamente para el análisis.
• Cómo usar los comandos para el análisis es mucho más fácil buscarlo en
Google o preguntarle a alguien cómo hacerlo comparado con la limpieza de
datos, la gestión de datos y el aseguramiento de la calidad de los datos.

25/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

En palabras sencillas

“Cuando tu código funciona, solo estás a medias”.

26/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Revisar el código de las demás

• Compare su código y discuta las diferencias con otras personas.


• Pregunte qué es más fácil de entender si piensa en su do file como una
instrucción. ¿Que es difícil?
• Aplique un pensamiento crítico al trabajo de datos al código de cada uno,
i.e., pruebe si habrá errores en su código, o si faltan datos.
• Si nadie le permite ver su código, pídale a las personas que lo vean.
• ¿Alguna vez le has pedido a alguien que te ayude a corregir tu documento de
Word?

27/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Leer el código de otras personas

• Busque el código en GitHub


• [Link] (Stata)
• [Link] (Stata y otros
idiomas)
• Googlear, pero antes, hágase preguntas críticas sobre el código que encontró.
• ¿Por qué esta persona programó de esta manera?
• ¿Esto se aplica a mi contexto?

28/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Literatura de gestión de bases de datos

• La carpeta de su proyecto es una base de datos informal, y personas muy


inteligentes que trabajan con bases de datos han estado pensando mucho
en esto.
• No tengo un libro específico para recomendar, ya que no conozco un libro
escrito para nuestro contexto, por lo que este método no es para los débiles

29/30
Introducción al Curso Organización del Curso Materiales del Curso Programación 101

Conclusión

• Su código es una herramienta que debe desarrollar como si otras personas


lo estuvieran usando.
• Solicite ayuda de sus pares para revisar su código.
• Al enviar el código, formatee con el mismo cuidado que formatearía su
currículum o su carta de presentación.

30/30
Nos vemos mañana.

También podría gustarte