Deuda de Letras y Bonos en la República Argentina

Bienvenido a otro interesante trabajito de obtención, visualización y análisis de datos abiertos en Argentina.  Anteriormente compartí unos resultados obtenidos de analizar los Boletines Oficiales y extraer algunos datos útiles acerca de las letras y bonos adquiridos por la República Argentina.  En el gráfico se puede observar el lamentable “Default” que transitó nuestro país entre el 2002 y 2007 (ningúna deuda es adquirida en ese tiempo, sinó que se mas bien se pagaron las deudas).

En estos últimos años y meses nuestro pais se ha reinsertado al mundo, indudablemente se está invirtiendo mucho en infraestructura, seguramente las deudas adquiridas son un reflejo de ello, aunque también es importante invertir para luego poder pagar las deudas.  Espero no estar equivocado en este razonamiento, prefiero ser optimista.  De todas formas, me parece muy valioso poder “observar” y monitorear la deuda.

Screenshot from 2017-09-26 21-59-37

Los datos están disponibles en el repositorio.  Este trabajo es compartido también con el propósito de recibir algún comentario: si hubiese algún dato erroneo, se lo corregirá a la brevedad.  Cada puntito en el gráfico tiene un enlace que le permitirá navegar el origen de los montos:

Screenshot from 2017-09-26 22-02-33

Aquí está disponible la “visualización“.  Por ejemplo, se puede observar que durante este mes de Septiembre Nación ha adquirido una deuda de 1.879.603.000 (mil ochocientos millones de dólares).

Screenshot from 2017-09-26 22-07-02Y si desea acceder a los detalles, solo hay que pinchar con el ratón en el enlace “detalles”, que abrirá una nueva ventana con el texto:Screenshot from 2017-09-26 22-08-56

Estos mil ochocientos millones están compuestos por dos bonos.

Bueno, ha llegado el final de este pequeño trabajito, espero haber sumado al conocimiento y transparencia desde mi humilde lugar.  Agradazco como siempre su visita y tiempo, hasta pronto.

-=[ Comunidad Datos Abiertos en Argentina ]=-

Anuncios

Sueldos de Sysadmin/Devops en República Argentina, año 2017

Bienvenido a un nuevo artículo de este entretenido mundo de el análisis de datos.  Esta vez quise analizar una encuesta de sueldos percibidos por informáticos en Argentina, creada y publicada por Sysarmy.

Como todo conjunto de datos, viene con cosas que hay que normalizar.  El criterio que utilicé es debatible pero no es la intención de este artículo cuestionar las decisiones de agrupamiento para estandarizar un poco los datos.  También tuve que eliminar personas que tenian un sueldo por arriba de 3 desvios estandar para tener un dato un poco mas creible.

¿ Cuál es la diferencia de sueldo promedio dependiendo de los años de experiencia de un Sysadmin/Devops en Argentina ?

Como sería de esperar se puede observar que en el promedio, se tiende a una relación entre años de experiencia y sueldo percibido.  Estas son estadísticas, no casos puntuales.  Para más de 10 años de experiencia se observa un sueldo promedio de $ 33000, pero como se distribuyen los sueldos ?

Screenshot from 2017-09-15 20-37-31Screenshot from 2017-09-15 20-36-44

devops <- datos[ datos$Trabajo.de == "SysAdmin / DevOps", ]
devops <- devops [ !devops$Salario.mensual..en.tu.moneda.local. > 65000, ];
devops <- droplevels(devops);
devops1 <- aggregate(devops$Salario.mensual..en.tu.moneda.local. ~ devops$Años.de.experiencia, FUN=mean);
u <- as.numeric(unlist(c(devops1[2])));
v <- as.character(unlist(devops1[1]));
#
ggplot(data=devops1, aes(x=v, y=u)) + scale_y_continuous(breaks=seq(0,45000,3000)) +
geom_bar(fill = "dark blue", stat = "identity") + 
ggtitle("Sueldo mensual de SysAdmin / DevOps en Republica Argentina - 2017") +
scale_x_discrete(limits=v) + xlab("Años.de.experiencia") + ylab("Salario.mensual")

¿ Como será la distribución de sueldos de Sysadmin/Devops según años de experiencia ?

Un Senior con 10 años de experiencia, según esta estadística puede cobrar en promedio unos $40.000 (bruto) y $ 30.000 (neto), se puede observar que también hay posibilidad de cobrar sueldos mayores aunque no es lo más común.

Screenshot from 2017-09-15 20-43-27

Screenshot from 2017-09-15 20-44-08

 

u <- as.numeric(devops$Salario.mensual..en.tu.moneda.local.)
v <- devops$Años.de.experiencia
ggplot(devops, aes(x=v, y=u)) + 
scale_y_continuous(breaks=seq(0,66000,3000)) +
ggtitle("Sueldo mensual de SysAdmin / DevOps en Republica Argentina - 2017") +
xlab("Años.de.experiencia") + 
ylab("Salario.mensual") +
geom_boxplot()

Este fué un breve análisis sobre los datos de una encuesta de sueldos percibidos por informáticos en la República Argentina.

Código fuente en github y Comunidad Datos Abiertos Argentina

Gracias por su visita, hasta la próxima!

Datos Abiertos, DNI de designaciones de personal en la República Argentina desde 1998 a la actualidad

Screenshot from 2017-09-10 22-20-29Mucha gente pequeña en lugares pequeños haciendo cosas pequeñas, puede cambiar el mundo” Eduardo Galeano

En la República Argentina estamos avanzando a pulmón y en gran parte voluntariamente para fortalecer el espíritu de la transparencia.  En un artículo previo compartí un ejemplo de cómo se puede extraer información de los boletines oficiales, particularmente las designaciones a puestos en el estado.

Me contacta un amigo y me pregunta si se podrán extraer los DNI de los boletines oficiales.  Esto me motivó a filtrar al menos un poco más los datos compartidos anteriormente y estudiar la viabilidad de extraer los D.N.I. de las personas designadas.  Me encontré con algunas particularidades de este nuevo mundo llamado “boletín oficial”.

  • Muchas personas designadas no tienen el DNI, esto ocurre cuando la persona entró hace mucho al estado y luego al cambiar de posición ya no se repite el DNI.
  • Por algún motivo hay muchísimo contrato, por 180 dias por ejemplo y que lo van renovando por mucho tiempo (no estoy juzgando).
  • Ha ocurrido que se designan varias personas cuyos nombres estan en tablas con imágenes, en ANEXOS y esto dificulta su identificación.

El nuevo gráfico se puede acceder aca.  Podra observar que ahora cada punto tiene dos enlaces: “dnis” y “full”, estos llevan al detalle de los DNI de las personas designadas que pude identificar, y un listado sin filtrar con muchos falsos positivos.

Screenshot from 2017-09-10 19-14-03

Quiero aclarar que algunas designaciones son falsos positivos, este trabajo sigue en evolución pero espero que resulte de interés al lector.  Los falsos positivos, algunos se deben a designaciones prorrogadas; entiendo que se suspende ó posterga, no estoy seguro.

Gracias por leer estas notas, bienvenido y hasta la próxima !

Comunidad de Datos Abiertos Argentina

 

 

Analizando datos abiertos para determinar cuánto dinero recaudó el ciberataque con el ransomware WannaCry

El viernes 12 de Mayo un amigo me contacta y me cuenta una novedad:  Telefónica de España estaba siendo atacada por un RansomWare.  Un RansomWare es un programa que cifra los archivos y exige un rescate a cambio de des-cifrarlos.  Se supo luego que este Ransomware es conocido con el nombre de “WannaCry” y que se mete en las computadoras aprovechando una vulnerabilidad llamada “EternalBlue“.  Esta vulnerabilidad era parte de el armamento digital secreto de la CIA.  Aunque Wikileaks divulgó los detalles muchas empresas muy importantes no han instalado el parche de seguridad correspondiente.

El ataque de este Ransomware se propagó a otras empresas alrededor del mundo.  El RansomWare pide un rescate de u$d 300 en bitcoins.

Screenshot from 2017-08-19 21-15-32

El “WannaCry” solamente acepta el pago en Bitcoins, en su versión original el “WannaCry v1” usa la dirección bitcoin 12t9YDPgwueZ9NyMgw519p7AA8isjr6SMw para recibir lo que sería “el rescate”.

Me pregunté:  ¿ Cuánto habra recaudado esta version del Ransomware y podré usar datos abiertos para responder esa pregunta ?

El Bitcoin como muchos sabran es una exitosa cryptomoneda y funciona gracias a la tecnología llamada Blockchain que excede al menos la intención de este artículo.  Solamente voy a mencionar que se pueden consultar todas las transacciones hechas en bitcoins, por ejemplo aca.

Tras algo de data crunching y scripting pude tener todas las transacciones recibidas por esta dirección de bitcoins y armar un grafico con las cantidades de dinero de rescate pagado, en montos acumulados y a medida que fueron enviadas.  En algún momento la recepción de dinero se detiene, muy posiblemente gracias a que un investigador llamado Marcus Hutchins descubrió una manera de detener este ataque.  Esto provocó que surjan nuevas versiones mejoradas de este Ransomware posiblemente con ótra dirección Bitcoin que no he tenido en cuenta en este caso.

Screenshot from 2017-09-08 00-15-30

Se observa que en total se recaudaron unos 17 BTC (Bitcoins), a la fecha un bitcoin sale unos U$D 4500.

Link al grafico interactivoLink a los datos

El conocimiento y experiencia de Marcus Hutchins es asombroso, aunque lamentablemente lo detuvo el FBI en la conferencia de seguridad DEFCON hace unas semanas acusandolo de vender un software que roba cuentas bancarias.  No quiero entrar en un debate al respecto.

Comunidad de Datos Abiertos Argentina.

Espero que les haya gustado este analisis veloz sobre los bitcoins, espero tener tiempo para profundizar y compartir más cosas curiosas.

Datos Abiertos, (Estimado) designaciones de personal en la Republica Argentina desde 1998 a la actualidad.

Procedimiento de preparación de los datos: Se analizaron aproximadamente 13000 documentos correspondientes a los Boletines Oficiales del Gobierno Nacional desde 1998 hasta la fecha. En los últimos años se comparten los Boletines Oficiales en formato PDF con contenido exportable a texto. Años anteriores los documentos PDF son el escaneo digital de un documento impreso lo cuál obstaculiza la transformación a texto. De todas formas hay que aclarar que aún hoy se utilizan imágenes de tablas con texto embebidas en PDF lo cuál queda aún por resolver la apertura de estos datos.
Los documentos en PDF han sido transformados a texto y a continuación se buscó aquellos párrafos en los que se menciona alguna designación.

Dicho esto queda claro que los números del gráfico son aproximaciones, existen aunque pocos, casos en los que no se trata de una designación real. Hay también otros casos en los que los datos del personal desginado se encuentra en tablas no exportables a texto por tratarse de imágenes, este problema queda aún pendiente de ser resuelto auque se está trabajando en ello.

Cada punto en el gráfico de linea agrupa las asignaciones de ese mes. Puede acceder a los detalles respecto al dato haciendo click en el enlace que aparece al ubicar el cursor del ratón sobre cada punto.

Screenshot from 2017-07-25 10-00-13

Si coloca el puntero del ratón sobre los puntos puede “pinchar” en el enlace “fuente” y explorar el detalle de las designaciones.

Screenshot from 2017-07-25 09-59-52

Visualización interactiva.

Visualizaciones usando datos abiertos.

Comunidad de Datos Abiertos Argentina.

 

 

Cinemometros en Argentina Julio 2017

Llegan las vacaciones de invierno y muchos se encaminan en sus vehiculos al Sur de nuestro hermoso país.  No obstante hay que estar atento y ser cuidadoso en la ruta, también hay que prestar atención a las multas truchas (infracciones de tránsito por alta velocidad emitida por radares malignos abandonados y enfadados).  Mucho cuidado con esos radares autónomos.

Acá hay un gráfico de los radares habilitados en Julio respecto de años atras.

Screenshot from 2017-07-11 00-21-02

 

Como siempre, puede acceder a los Datos Abiertos de Cinemómetros Argentinos 2017 en mi github así como el procedimiento para liberarlos de su PDF original.  Agradezco a INTI por compartir ese PDF en su portal.

 

 

Comunidad de Datos Abiertos Argentinos

Jauria de Datos Abiertos y Perros en una ciudad Mascotera

En Nueva York (Estados Unidos) existe un registro de los perros en la ciudad.  Se trata de una base de datos con detalles interesantes acerca de las mascotas que acompañan a sus dueños.  PFrank1ara los Neoyorkinos es obligatorio registrar a sus mascotas, aunque lamentablemente solamente 1 de 5 respeta la normativa.  Me parece una excelente idea, siendo nuestra ciudad tan “Mascotera” no estaria mal un registro abierto de mascotas.  La ley 14107 habla de registrar solamente a los “perros potencialmente peligrosos”,  y deja de lado aquellos perritos mas pequeños que quizás no sean peligrosos pero si conviven con nosotros todos los días.

En Nueva York usaron este conjunto de datos y han elaborado varias ideas interesantes.  En un principio analizaron los nombres de los perros y su ubicación, aunque también correlacionaron cantidad de perros y zonas más caras (ó de mejor poder adquisitivo).

Me pareció una muy buena idea, y busqué si existe algo asi en alguna ciudad de nuestro país aunque todavía no pude encontrarlo.  Esto es un ejemplo de que hay muchisimas oportunidades de implementar políticas de Datos Abiertos en la Ciudad Mascotera de Buenos Aires.

 

Comunidad de Datos Abiertos