0% encontró este documento útil (0 votos)
45 vistas34 páginas

Capitulo I

Cargado por

Mayor Queyo
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
45 vistas34 páginas

Capitulo I

Cargado por

Mayor Queyo
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd

1

CAPITULO 1

1. CONCEPTOS BSICOS: ESTADSTICOS E INFORMTICOS A UTILIZARSE.

1.1 Definicin de Estadstica La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin de datos numricos presentada de forma ordenada y sistemtica.

Esta idea es la consecuencia del concepto popular que existe sobre el trmino y que cada vez est ms extendido debido a la influencia de nuestro entorno, ya que hoy da es casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc., no nos aborde diariamente con cualquier tipo de informacin estadstica sobre accidentes de trfico, ndices de crecimiento de poblacin, turismo, tendencias polticas, etc. Slo cuando nos adentramos en un mundo ms especfico como es el campo de la investigacin de las Ciencias Sociales: Medicina, Biologa, Psicologa, etc., empezamos a percibir que la Estadstica no slo es algo ms, sino que se convierte en la nica herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrnseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Podramos, desde un punto de vista ms amplio, definir la estadstica como la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de accin en situaciones prcticas que entraan incertidumbre.

1.2 Clasificacin de la Estadstica Podramos por tanto clasificar la Estadstica en descriptiva, cuando los resultados del anlisis no pretenden ir ms all del conjunto de datos, y

estadstica inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos ms amplio.

1.3

Estadstica descriptiva

Describe, analiza y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. Para esto se utilizan las tablas y grficos de frecuencias absolutas y relativas, y los estimadores de las medidas de tendencia central, dispersin, sesgo y kurtosis.

1.3.1

Tablas de frecuencia, es una tabla resumen en la que se

disponen los datos divididos en grupos ordenados numricamente, denominados clases o categoras. El nmero de datos u observaciones que pertenecen a determinada clases de llama frecuencia de clase, el punto medio de cada clase o categora se llama marca de clase y la longitud de una clase se conoce como intervalo de clase. La frecuencia absoluta es el nmero o cantidad de observaciones iguales o semejantes que se encuentran comprendidas dentro de un determinado intervalo de clase: mientras la frecuencia relativa es el cociente que resulta de dividir la frecuencia absoluta de una clase para la suma total de frecuencias de todas las clases de una tabla de frecuencias.

Representacin Grfica.- La representacin grfica de una distribucin de frecuencias depende del tipo de datos que la constituya.

1.3.2

Representacin Grfica: Diagrama de sectores: Est representacin grfica consiste en

1.3.2.1

dividir un crculo en tantos sectores circulares como modalidades presente el carcter cualitativo, asignando un ngulo central a cada sector circular proporcional a la frecuencia absoluta ni, consiguiendo de esta manera un sector con rea proporcional tambin a ni.
1.3.2.2

Histograma: Al ser esta representacin una representacin por

reas, hay que distinguir si los intervalos en los que aparecen agrupados los datos son de igual amplitud o no.

1.3.3 Medidas descriptivas Los fenmenos biolgicos no suelen ser constantes, por lo que ser necesario que junto a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una medida que haga referencia a la variabilidad que refleje dicha fluctuacin. Estudiaremos los estadsticos que nos van a orientar sobre cada uno de estos niveles de informacin: valores alrededor de los cuales se agrupa la muestra, la mayor o menor fluctuacin alrededor de esos valores, nos interesaremos en ciertos valores que marcan

posiciones caractersticas de una distribucin de frecuencias as como su simetra y su forma. (Ver figura 1.1)

Figura 1.1 Medidas representativas de un conjunto de datos estadsticos

En este sentido pueden examinarse varias caractersticas, siendo las ms comunes:


La tendencia central de los datos; La dispersin o variacin con respecto a este centro; Los datos que ocupan ciertas posiciones. La simetra de los datos. La forma en la que los datos se agrupan.

1.3.4

Estadsticos de tendencia central: las tres medidas ms usuales

de tendencia central son la media, mediana y moda.

1.3.4.1

La Media. Tambin llamada media aritmtica, es una medida

descriptiva que se calcula sumando los valores numricos y dividiendo entre el nmero de valores. A la media poblacional se la conoce como (mu) y la media muestral como x (x barra). Clculo de la media poblacional :
=

x
N

Donde N es el tamao de la poblacin y x son los valores de los datos de la poblacin. Clculo de la media muestral x :
x=

x
n

Donde n es el tamao de la muestra y x son todos los valores que toma la muestra.

1.3.4.2

La Mediana es el valor central de la variable, es decir,

supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra. La principal caracterstica de esta medida es que al menos el 50% de las observaciones son menores o iguales a ella.

Calculo de la mediana: cuando N es impar, hay un trmino central

xN +1 2

que ser el valor de la mediana. Cuando N es par, hay dos trminos centrales la mediana ser el promedio de estos dos valores.

1.3.4.3

La moda es el valor de la variable que tenga mayor frecuencia

absoluta, la que ms se repite, es la nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin de ningn clculo

1.3.5 Medidas de variabilidad o dispersin

Los estadsticos de tendencia central o posicin nos indican donde se sita un grupo de puntuaciones. Los de variabilidad o dispersin nos indican si esas puntuaciones o valores estn prximas entre s o si por el contrario estn o muy dispersas. Algunas de las principales medidas son:

1.3.5.1

Rango. Se obtiene restando el valor ms bajo de un conjunto

de observaciones del valor ms alto, se denota como R. Es fcil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes: No utiliza todas las observaciones (slo dos de ellas); Se puede ver muy afectada por alguna observacin extrema;

El rango aumenta con el nmero de observaciones, o bien se queda igual. En cualquier caso nunca disminuye.

1.3.5.2

Varianza. Es una medida de dispersin que mide la tendencia

de las observaciones individuales a desviarse con respecto a la media. La varianza para los datos de una poblacin esta determinada por la siguiente ecuacin:

(x ) =
N

Donde x son los valores de la poblacin, es la media poblacional y N es el nmero de observaciones en la poblacin.

1.3.5.3

Desviacin Estndar tambin mide la variabilidad de las

observaciones con respecto a la media, es igual a la raz cuadrada de la varianza. Esta medida de dispersin siempre es positiva y se denota por

. Se calcula a travs de la ecuacin: =

(x )
N

1.3.6

Medidas de posicin. Las medidas de posicin o localizacin

dividen la distribucin en partes iguales, sirven para clasificar a un individuo o elemento dentro de una determinada poblacin o muestra. stas son:

Cuartiles: divide a la poblacin o muestra en cuatro partes iguales. Deciles: divide a la poblacin en diez partes iguales. Percentiles: divide a la poblacin en cien partes iguales.

1.3.7

Simetra de los datos. Sabemos cmo calcular valores alrededor

de los cuales se distribuyen las observaciones de una variable sobre una muestra y sabemos cmo calcular la dispersin que ofrecen los mismos con respecto al valor de central. Nos proponemos dar un paso ms all en el anlisis de la variable. En primer lugar, nos vamos a plantear el saber si los datos se distribuyen de forma simtrica con respecto a un valor central, o si bien la grfica que representa la distribucin de frecuencias es de una forma diferente del lado derecho que del lado izquierdo.

1.3.8

Medida de apuntamiento, Curtosis: La curtosis es una medida

del apuntamiento, que nos indicar si la distribucin es muy apuntada o poco apuntada. Este coeficiente lo vamos a denotar por K y se calcula segn la siguiente expresin:

10

1.4

ESTADISTICA INFERENCIAL

El propsito de un estudio estadstico suele ser, como hemos venido citando, extraer conclusiones acerca de la naturaleza de una poblacin. Al ser la poblacin grande y no poder ser estudiada en su integridad en la mayora de los casos, las conclusiones obtenidas deben basarse en el examen de solamente una parte de la muestra, lo que nos lleva, en primer lugar a la justificacin, necesidad y definicin de las diferentes tcnicas de muestreo.

Los primeros trminos obligados a los que debemos hacer referencia, sern los de estadstico y estimador.

Dentro de este contexto, ser necesario asumir un estadstico o estimador como una variable aleatoria con una determinada distribucin, y que ser la pieza clave en las dos amplias categoras de la inferencia estadstica: la estimacin y el contraste de hiptesis.

El concepto de estimador, como herramienta fundamental, lo caracterizamos mediante una serie de propiedades que nos servirn para elegir el mejor para un determinado parmetro de una poblacin, as como algunos mtodos para la obtencin de ellos, tanto en la estimacin puntual como por intervalos.

11

La tarea fundamental de la estadstica inferencial, es hacer inferencias acerca de la poblacin a partir de una muestra extrada de la misma.

1.4.1 Tcnicas de muestreo sobre una poblacin

La teora del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribucin de un carcter en dicha poblacin y las distribuciones de dicho carcter en todas sus muestras.

Las ventajas de estudiar una poblacin a partir de sus muestras son principalmente: Coste reducido Mayor rapidez Ms posibilidad de estudio

De este modo se ve que al hacer estadstica inferencial debemos enfrentarnos con dos problemas:

Eleccin de la muestra (muestreo). Extrapolacin de las conclusiones obtenidas sobre la muestra, al resto de la poblacin (inferencia).

12

1.4.2 Tipos de errores

Entre la muestra con la que se trabaja y la poblacin de inters, aparece la denominada poblacin de muestreo: poblacin (la mayor parte de las veces no definida con precisin) de la cual nuestra muestra es una muestra aleatoria. En consecuencia la generalizacin est amenazada por dos posibles tipos de errores: error aleatorio que es el que las tcnicas estadsticas permiten cuantificar y crticamente dependiente del tamao muestral, pero tambin de la variabilidad de la variable a estudiar y el error sistemtico que tiene que ver con la diferencia entre la poblacin de muestreo y la poblacin de inters y que slo puede ser controlado por el diseo del estudio.

El problema se resuelve en base al conocimiento de la "distribucin muestral" del estadstico que se use. Concretando, por ejemplo en la media. Si para cada muestra posible calculamos la media muestral ( ) obtenemos un valor distinto ( es un estadstico: es una variable aleatoria y slo , llamada distribucin

depende de la muestra), habr por tanto una fpd para

muestral de medias. La desviacin tpica de esta distribucin se denomina error tpico de la media. Evidentemente, habr una distribucin muestral para cada estadstico, no slo para la media, y en consecuencia un error tpico para cada estadstico.

13

Si la distribucin muestral de un estadstico estuviera relacionada con algn parmetro de inters, ese estadstico podra ser un estimador del parmetro.

1.5

SISTEMAS DE INFORMACION

Se est viviendo un mundo que avanza aceleradamente hacia la globalizacin; un mundo en el que la informacin viaja rpidamente a cualquier parte del globo terrqueo. En este ambiente de cambio acelerado, Internet juega un papel fundamental. Esta tecnologa que, al principio de los aos 70 estuvo restringida al campo de la defensa y el ambiente acadmico, comenz como un experimento impulsado por el Departamento de Defensa de Estados Unidos. Esa red llamada ARPAnet fue la que permiti, por primera vez, a los investigadores, cientficos y acadmicos de los Estados Unidos estar en contacto. Fue, la predecesora de la Internet. Aunque en ocasiones no se sepa realmente de qu se trata el Internet, cada vez se va haciendo mas evidente, que ste prototipo de la "autopista de la informacin", visionada por Al Gore, es la herramienta que permite acceder y compartir desde cualquier lugar y a un bajo precio, una cantidad ingente de informacin hasta ahora ni siquiera vislumbrada. La rpida expansin, gracias a un incremento de su funcionalidad y facilidad de uso, la ha alejado de sus primeros usuarios exclusivamente militares y

14

cientficos, y la ha llevado a incluir una gama de informacin que oscila desde los temas ms desconocidos, hasta los de importancia mundial. Dentro de esta vasta y heterognea cantidad de informacin, la Medicina no poda ser ajena, ya que esta disciplina es una en las que se usa y necesita mayor cantidad de informacin, adems de la importancia que posee. Internet y el desarrollo de nuevas tecnologas asociadas, est revolucionando campos de la medicina como la educacin mdica continuada, investigacin, telemedicina, o incluso los sistemas de informacin y redes internas de los centros sanitarios. Sin embargo, Internet no es slo una fuente valiosa para encontrar lo ms relevante en investigacin y educacin mdica, sino tambin, un importante recurso de informacin en el entorno clnico. La informacin mdica, en tanto que conocimiento mdico til para el cuidado de los pacientes individuales, proviene, por un lado, de la obtenida del paciente a partir de la historia y examen clnico, resultados de pruebas diagnsticas, etc. y por otro, de lo que conocemos como saber mdico en forma de investigacin original, revisiones, libros de texto, guas de prctica clnica o en forma de experiencia acumulada por el mdico prctico. El principal atractivo que ofrece hoy Internet, es el servicio denominado World Wide Web, que proporciona una interfaz grfica donde la informacin

15

se presenta en forma de pginas unidas con enlaces hipertexto y por las que es fcil desplazarse para buscar documentos. En el World Wide Web (Web o WWW) los documentos no slo estn en formato texto, sino que pueden contener imgenes, pelculas, sonidos y grficos en tres dimensiones, lo que le da una autntica capacidad multimedia. El Web permite saltar mediante un "hiperenlace" de una pgina a otra, situadas en el mismo ordenador o en uno remoto, se compone as una red que simplifica y agiliza el acceso a la informacin, independientemente de donde sta se encuentre. No slo se puede encontrar informacin en Internet, tambin se puede publicar. Una vez en formato electrnico, hacer accesible la informacin en la red es relativamente fcil y econmico. Programas y protocolos, boletines de informacin teraputica y otros documentos que publican las reas de salud, que hasta ahora se comportaban como literatura gris, se hacen ahora visibles para sus usuarios y toda la comunidad cientfica. La publicacin de libros y otros materiales en el WWW permite aadir a estos documentos la capacidad multimedia, la posibilidad de unir mediante enlaces a otros documentos, nueva informacin a la que contiene el texto original y sobre todo superar uno de sus mayores handicaps: la actualizacin peridica.

16

Una base de datos dedicada a la medicina es Medline, una de las mejores y ms utilizadas del mundo, la cual gracias a Internet, se puede acceder de forma gratuita. Las herramientas como el Web permiten agrupar en nico documento la distinta informacin que genera el encuentro clnico, desde texto a imgenes diagnsticas, pasando por sonidos o grficos. A la vez se puede integrar el registro clnico con los sistemas de gestin generales y con recursos mdicos de redes externas como la propia Internet. El desarrollo de un sistema de informacin global en las organizaciones sanitarias, se beneficia as de las potentes soluciones tecnolgicas creadas y probadas da a da en Internet. Internet no es todava la solucin a los problemas de informacin planteados por los mdicos. La complejidad en las herramientas necesarias para su uso, lo extensivo y complejo de la informacin contenida en ella, son razones para que el uso de Internet sea an reducto de entusiastas. A esto se aadira la incapacidad de los empleadores o instituciones en las que los mdicos trabajan, para proporcionar el equipo necesario en el lugar de trabajo. Sin embargo Internet est cambiando la forma en que las personas acceden a la informacin y se comunican en todo el mundo. La forma de acceder a la informacin mdica y los sistemas de informacin sanitarios se vern modificados a medio plazo, dando una nueva oportunidad para proporcionar un mejor cuidado a nuestros pacientes. Internet, a poco que se perfeccione,

17

ser esa herramienta fsica y funcionalmente accesible, que el mdico de atencin primaria necesita en su quehacer diario. Los importantes cambios sociales, polticos y econmicos en las sociedades estn condicionando la evolucin de los modelos sanitarios y asistenciales tradicionales. Los cambios demogrficos, el incremento de los costos de la sanidad, la necesidad de mejorar la calidad asistencial, la bsqueda de equidad social, y la apertura de nuevos mercados, son algunos de los aspectos que hacen necesaria una nueva concepcin de la asistencia sanitaria en la que fuera de toda duda, las tecnologas de la informacin y la telecomunicacin juegan un papel importante.

Por sistemas de informacin mdica se entiende la parte de la informtica mdica que se ocupa del estudio y utilizacin de la informtica y de la informacin en el rea de la Salud y de la asistencia sanitaria.

Por lo tanto, la implementacin del sistema de informacin para mdicos permitira al mdico, mejorar el acceso a informacin complementaria para su desempeo y por lo tanto mejorara la calidad y atencin de las personas que acuden diariamente a algn centro de salud.

18

1.5.1 Beneficios al implantar un sistemas de informacin para mdicos

Al implementar el sistema de informacin para mdicos, el usuario podr acceder mediante una interfaz sencilla y orientada a los siguientes beneficios:

1.5.1.1

Informacin mdica de forma continua: El mdico se mantendr

informado sobre la realizacin de talleres, cursos, jornadas o congresos que sean de su inters.

1.5.1.2

Auto evaluacin mdica continua: El mdico permanecer en

una constante evaluacin supervisada por especialistas en el rea, para mejorar sus habilidades y destrezas en el medio. Un conjunto de preguntas, temas y discusin de enfermedades que requieran un tratamiento especial con mayor profundidad.

1.5.1.3

Acceso a informacin mdica en bases de datos reconocidas:

El mdico podr obtener informacin mdica de avanzada sobre tpicos de inters en lo referente a la actualidad mdica y cientfica regional, nacional e internacional. Con la conexin a Internet la permitir acceder a

19

una ilimitada fuente de informacin como al servidor temtico de biosalud, bases de datos como: Medline, Toxline, etc.

1.5.1.4

Consultar casos clnicos a mdicos especialistas: El mdico

podr consultar casos clnicos de su prctica diaria, con especialistas en el rea, mejorando los resultados mdicos con mayor satisfaccin y comodidad para el paciente.

1.5.2

Fracasos en la implementacin

1.5.2.1

Compra de hardware sin tener en cuenta su programacin,

generalmente debido a los grupos de marketing que venden mquinas asegurndoles que les van a solucionar todos los problemas. El Hardware es una parte del plan de informatizacin y sus caractersticas deben estar supeditadas a las necesidades del lugar y al tipo de software a utilizar.

1.5.2.2

Desconocimiento informtico del medio hospitalario. Las

principales, surgen de la falta de especializacin en el tema de informtica mdica, esto genera un dilogo de sordos entre el profesional mdico y el informtico, quien no sabe interpretar las necesidades del usuario y como consecuencia desarrolla implementaciones poco

20

prcticas que no se pueden utilizar. Hoy en da la informtica mdica es una especialidad. La mayora de las facultades de medicina estn incorporando la materia en el currculo universitaria.

1.5.2.3

Falta de planificacin. Al no definir los objetivos a corto,

mediano y largo plazo, ni de desarrollar un plan donde se estudia la asignacin de recursos y esto lleva a abortar el proyecto. Sin la adecuada es imposible efectuar una implementacin duradera.

1.5.2.4

No tener en cuenta la evolucin del sistema y futuras

adaptaciones a las necesidades del medio. Permanentemente es necesario realizar adaptaciones y modificaciones, siendo necesario contemplar en la implementacin de los sistemas el mantenimiento y la evolucin del mismo.

1.5.2.5

No incorporar las nuevas tecnologas en hardware y software.

La evolucin de hardware es vertiginosa y debe ir adecundose el mismo en forma permanente. No existe un equipo de computacin eterno, sino ms bien por el contrario, el hardware tiene muy corta vigencia (por ms que siga funcionando varios aos) desde el punto de vista tecnolgico.

21

1.5.2.6

Falta de decisin poltica para la implementacin de la

informatizacin. Existe en muchos sectores que ponen resistencia a la incorporacin de la informtica por diferentes razones. Sin una decisin poltica de implementarla, el plan va indudablemente al fracaso.

1.5.2.7

Desarrollar sistemas autnomos y no un sistema global que

permita la independencia de tareas. Si cada sector tiene su sistema sin tener en cuenta el proyecto global el sistema no cuenta con una planificacin y va al infortunio.

1.5.2.8

La falta de familiaridad de mdicos y paramdicos para con las

computadoras.

1.5.2.9

La interfaz con el usuario es lo ms amigable posible. Una

interfaz que dificulte la interaccin del operador con la computadora es un factor conocido de rechazo del uso de computadoras. El perfil actual y futuro de usuario de computadoras es el de un individuo completamente ignorante del funcionamiento de una computadora, lo cual impone una conducta a diseadores y administradores que es bien clara: proveer sistemas de computacin en los que l dilogo con el operador sea simple e implique el menor esfuerzo de aprendizaje posible. El concepto se basa en el reemplazo de los comandos de lnea y mens de los

22

sistemas operativos clsicos, por smbolos grficos o iconos que son verdaderos representaciones grficas de objetos reales. Un ejemplo bien conocido es el reemplazo del comando <borrar> por el de un pequeo dibujo de un cesto de basura hacia el cual son desplazadas las representaciones grficas del archivo a borrar.

1.5.2.10 La falta de soporte tcnico multidisciplinario, que no lleve a cabo las modificaciones y adaptaciones que se requieren en cada sector.

1.6

BASES DE DATOS

Base de datos es cualquier conjunto de datos organizados para su almacenamiento en la memoria de un ordenador o computadora, diseado para facilitar su mantenimiento y acceso de una forma estndar. La informacin se organiza en campos y registros. Un campo se refiere a un tipo o atributo de informacin, y un registro, a toda la informacin sobre un individuo. Por ejemplo, en una base de datos que almacene informacin de tipo agenda, un campo ser el NOMBRE, otro el NIF, otro la DIRECCIN..., mientras que un registro viene a ser como la ficha en la que se recogen todos los valores de los distintos campos para un individuo, esto es, su nombre, NIF, direccin... Los datos pueden aparecer en forma de texto, nmeros,

23

grficos, sonido o vdeo. Normalmente las bases de datos presentan la posibilidad de consultar datos, bien los de un registro o los de una serie de registros que cumplan una condicin. Tambin es frecuente que se puedan ordenar los datos o realizar operaciones sencillas, aunque para clculos ms elaborados haya que importar los datos en una hoja de clculo. Para facilitar la introduccin de los datos en la base se suelen utilizar formularios; tambin se pueden elaborar e imprimir informes sobre los datos almacenados.

Desde su aparicin en la dcada de 1950, estas aplicaciones se han hecho imprescindibles para las sociedades industriales. La primera base de datos para PC data de 1980; era el dBase II, desarrollado por el ingeniero estadounidense Wayne Ratliff. Desde entonces, su evolucin ha seguido paralela a la que ha experimentado el software, y hoy existen desde bases de datos para una utilizacin personal hasta bases de datos corporativas, soportadas por grandes sistemas informticos.

Hay cuatro modelos principales de bases de datos: el modelo jerrquico, el modelo en red, el modelo relacional (el ms extendido hoy da; los datos se almacenan en tablas y se accede a ellos mediante consultas escritas en SQL) y el modelo de bases de datos deductivas. Otra lnea de investigacin en este campo son las bases de datos orientadas a objeto, o de objetos persistentes.

24

1.6.1 Motores de Bases de Datos

ODBC Open Database Connectivity OLAP Online Analytical Processing OLTP Online Transaction System DSS Decision Support System

DATA Warehouse OLTP + DSS. Una de las caractersticas principales del data warehouse es que permite que todos constantemente procesen y carguen datos. Utilizan las staging tables esto permite que el SQL maneje solo los datos

DATA Marts

Informacin sobre los motores de bases de datos lo puede consultar en la bibliografa recomendada en esta tesis.

1.6.2 SQL (Structured Query Language)

Lenguaje de consulta estructurado, en informtica, un lenguaje utilizado en bases de datos para consultar, actualizar y manejar bases de datos relacionales, una base de datos relacional utiliza los valores coincidentes de campos comunes de dos tablas para relacionar informacin de ambas. Se deriva de un proyecto de investigacin de IBM, que cre el "lenguaje

25

estructurado de consulta en ingls" (SEQUEL) a mediados de la dcada de 1970. El SQL es un estndar aceptado en productos de bases de datos, que fue utilizado comercialmente por primera vez por la empresa Oracle en 1979. A pesar de que no se trata de un lenguaje de programacin como puedan serlo C o Pascal, puede utilizarse en el diseo de consultas interactivas y puede incluirse en una aplicacin como un conjunto de instrucciones de manejo de datos (sentencias). Por ejemplo, basndose en soportes externos al propio lenguaje y aun al propio programa ya compilado (como es un servidor o un motor SQL que haga de puente entre la aplicacin, el sistema operativo y las bases de datos), lenguajes como Visual Basic o C/C++ pueden incluir sentencias SQL en su cdigo.

Aunque en el mercado se pueden encontrar diversas variantes (dialectos) del lenguaje SQL, todos tienen un mnimo comn basado en el estndar ANSI SQL de 1986, con extensiones propietarias. Desde 1991 se fueron realizando progresos para disponer de un estndar cada vez ms completo, conocido como SAG SQL, propiciado por el denominado SQL Access Group.

El SQL estndar cuenta con elementos destinados a la definicin, modificacin, control, proteccin de los datos y acceso a bases de datos distribuidas en una red, haciendo factible que varios usuarios puedan consultar la misma base de datos de forma simultnea. Debido a su

26

simplicidad, que proviene de ser sintctica y gramaticalmente cercano al lenguaje natural, pueden utilizarlo tanto los usuarios tcnicos como los que no lo son; esto, unido a su potencia, lo ha hecho muy popular.

1.6.3 Componentes del SQL

El lenguaje SQL est compuesto por comandos, clusulas, operadores y funciones de agregado. Estos elementos se combinan en las instrucciones para crear, actualizar y manipular las bases de datos.

1.6.3.1 a)

Comandos. Existen dos tipos de comandos: Los DDL (Data Definition Language) que permiten crear, eliminar y modificar tablas, campos e ndices en la base de datos, con las instrucciones Create, Drop y Alter

respectivamente.

b)

Los DML (Data Manipulation Language) que permiten generar consultas para ordenar, filtrar y extraer datos de la base de datos, con las instrucciones Select, Insert, Update, Delete.

27

1.6.3.2

Clusulas. Las clusulas son condiciones de modificacin

utilizadas para definir los datos que desea seleccionar o manipular. Entre ellas estn:
a) b) c) d) e)

From: Tabla de la cual se van a seleccionar los registros. Where: Condiciones que deben reunir los registros a seleccionar. Group by: Separar en grupos especficos los registros seleccionados. Having:Especifica condiciones que deben satisfacer cada grupo. Order by: Para ordenar los registros.

1.6.3.3
a)

Operadores Lgicos

And: Evala dos condiciones y devuelve un valor de verdad slo si

ambas son ciertas, es el y lgico.


b)

Or:

Evala dos condiciones y devuelve un valor de verdad si

alguna de las dos es cierta, es el o lgico.


c)

Not:

Devuelve el valor contrario de la expresin, es la negacin

lgica.

1.6.3.4
a) b)

Operadores de Comparacin

< Menor que > Mayor que

28

c) d) e) f) g) h) i)

<> Distinto de <= Menor igual que >= Mayor igual que = Igual que Between, especifica un intervalo de valores Like, se utiliza para comparar un modelo In, especifica registros de una bases de datos.

1.6.3.5

Funciones de agregado

Las funciones de agregado se usan dentro de una clusula SELECT en grupo de registros para devolver un nico valor que se aplica a un grupo de registros. Tenemos:
a) b) c)

AVG:

Calcula el promedio de un campo determinado

COUNT: Devuelve el nmero de registros de la seleccin SUM: Devuelve la suma de los valores de un campo

determinado
d) e)

MAX MIN:

Devuelve el mximo valor de un campo especificado Devuelve el mnimo valor de un campo especificado

La base de datos posee adems objetos como: a) b) Tabla ndice

29

c) d) e) f)

Vista Procedimientos almacenados Funcin o rol Desencadenador

1.7 LENGUAJES DE PROGRAMACIN

Al desarrollarse las primeras computadoras electrnicas, se vio la necesidad de programarlas, es decir, de almacenar en memoria la informacin sobre la tarea que iban a ejecutar. Las primeras se usaban como calculadoras simples; se les indicaban los pasos de clculo, uno por uno. Los lenguajes ms primitivos fueron los lenguajes de mquina. Esto, ya que el hardware se desarroll antes del software, y adems cualquier software finalmente tiene que expresarse en el lenguaje que maneja el hardware. La programacin en esos momentos era sumamente tediosa, pues el programador tena que "bajarse" al nivel de la mquina y decirle, paso a paso, cada punto de la tarea que tena que realizar. Adems, deba expresarlo en forma numrica; y por supuesto, este proceso era propenso a errores, con lo que la productividad del programador era muy limitada. Sin embargo, hay que recordar que en estos momentos, simplemente an no exista alternativa.

30

El primer gran avance que se dio, como ya se coment, fue la abstraccin dada por el Lenguaje Ensamblador, y con l, el nacimiento de las primeras herramientas automticas para generar el cdigo mquina. Esto redujo los errores triviales, como poda ser el nmero que corresponda a una operacin, que son sumamente engorrosos y difciles de detectar, pero fciles de cometer. Sin embargo, an aqu es fcil para el programador perderse y cometer errores de lgica, pues debe bajar al nivel de la forma en que trabaja el CPU, y entender bien todo lo que sucede dentro de l. Con el desarrollo en los 50s y 60s de algoritmos de ms elevado nivel, y el aumento de poder del hardware, empezaron a entrar al uso de computadoras cientficos de otras ramas; ellos conocan mucho de Fsica, Qumica y otras ramas similares, pero no de Computacin, y por supuesto, les era sumamente complicado trabajar con lenguaje Ensamblador en vez de frmulas. As, naci el concepto de Lenguaje de Alto Nivel, con el primer compilador de FORTRAN (FORmula TRANslation), que, como su nombre indica, inici como un "simple" esfuerzo de traducir un lenguaje de frmulas, al lenguaje ensamblador y por consiguiente al lenguaje de mquina. A partir de FORTRAN, se han desarrollado innumerables lenguajes, que siguen el mismo concepto: buscar la mayor abstraccin posible, y facilitar la vida al programador, aumentando la productividad, encargndose los compiladores o intrpretes de traducir el lenguaje de alto nivel, al lenguaje de computadora.

31

Hay que notar la existencia de lenguajes que combinan caractersticas de los de alto nivel y los de bajo nivel (es decir, Ensamblador). Mi ejemplo favorito es C: contiene estructuras de programacin de alto nivel, y la facilidad de usar libreras que tambin son caractersticas de alto nivel; sin embargo, fue diseado con muy pocas instrucciones, las cuales son sumamente sencillas, fciles de traducir al lenguaje de la mquina; y requiere de un entendimiento apropiado de cmo funciona la mquina, el uso de la memoria, etctera. Por ello, muchas personas consideramos a lenguajes como C (que fue diseado para hacer sistemas operativos), lenguajes de nivel medio.

1.7.1 HTML.- Conceptos Generales

Todas las pginas WEB han sido creadas usando un lenguaje especial conocido como Hypertext Markup Languaje (HTML), que permite organizar texto, grficos, animacin y sonido en documentos que un web browser (programa que interpreta este lenguaje y visualiza la informacin en la pantalla del computador) pueda reconocer. HTML es el lenguaje que hace el hipertexto e hipermedia posibles. Aunque HTML es en verdad un lenguaje, no es del tipo de lenguajes que tpicamente estn asociados a las computadoras y el desarrollo de software. No es necesario estudiar durante aos o tener una colegiatura para

32

aprenderlo. En lugar de esto, HTML es un leguaje amigable que prcticamente cualquier persona puede usar despus de uno o dos das. HTML es un leguaje que define un conjunto de reglas y procedimientos para preparar texto que va a ser distribuido, interpretado y presentado en forma electrnica; con HTML, se rodea al texto y sus referencias a archivos con directivas especiales conocidas como tags. Los tags son usados para especificar cmo el texto y los archivos aparecern en la pantalla cuando ellos sean visualizados por un web browser. El uso de tags para especificar los documentos que se usarn para publicaciones electrnicas es muy sencillo. Se puede usar un procesador de palabras estndar y agregar los tags de HTML necesarios y lograr tener una pgina WEB. Lo que hace realmente poderoso al HTML es su habilidad de organizar cualquier nmero de archivos en una sola pgina. Los archivos que aparecen en una pgina pueden estar localizados en la misma computadora que contiene la pgina o en cualquier lugar de la WEB. Cada archivo es almacenado de forma independiente con respecto a las pginas WEB que las visualizan. Lo que hace el HTML es guardar referencias a los archivos necesarios, dicindole al browser donde ubicarlos, de manera que se puedan ubicar en cualquier lugar de la web. En conclusin una pgina web es un bloque de texto o pginas de texto con enlaces (referencias) a imgenes,

33

animaciones, sonido y otros archivos que un browser los recepciona, procesa y visualiza.

1.7.2 ASP (Active Server Pages) Son pginas web dinmicas que contienen cdigo similar al de Visual Basic, que se ejecutan del lado del servidor y general cdigo HTML del lado del cliente. Son usadas para acceder a base de datos o realizar alguna transaccin solicitada por el usuario desde otra pgina web.

Active Server Pages (ASP) no se trata de un lenguaje de programacin sino de una tecnologa que permite introducir codificacin en las pginas webs para hacerlas dinmicas e interactivas. A travs de esta tecnologa podemos utilizar diferentes lenguajes de programacin para realizar las distintas acciones que deseemos.

El objetivo estndar de ASP es permitir el uso de casi cualquier lenguaje de programacin. Sin embargo, dado que se trata de una tecnologa creada por Microsoft, el lenguaje que utiliza bsicamente es el VBScript y, en segundo lugar el JScript. El VBScript es una versin especial del Visual Basic, con el cual comparte la mayora de sus funciones y mandatos. El JScript es la versin de JavaScript realizada por Microsoft.

34

Dado que ASP es una tecnologa de Microsoft, slo tiene un funcionamiento correcto con los servidores que utilizar Windows, pero no con los que emplean Unix u otros sistemas. En estos casos se deben utilizar otras tcnicas de programacin como, por ejemplo, el denominado PHP, que viene a ser equivalente del ASP. Para probar nuestras paginas antes de instalarlas en el servidor de Internet, debemos antes instalar un servidor en nuestro sistema.

El servidor que utilizar los sistemas de Windows es el denominado Internet Information Server (ISS), que es un servidor de gran capacidad, potencia y flexibilidad. Este servidor se est utilizando no slo en Internet sino tambin en Intranets corporativas. Existe una especie de versin reducida para intranets y para ordenadores particulares que se denomina Personal Web

Server (PWS). Ambos servidores se pueden obtener a travs del Option Pack de Windows.

También podría gustarte