Repaso a PyData 2013

Unos días después de la PyConUS 2013 se celebró la primera PyData del año (creo que serán semestrales de forma regular aunque el tiempo dirá). Entre las charlas había algunas introductorias, otras más avanzadas y otras enseñando aplicaciones prácticas.

Entre las charlas introductorias destacaremos:

Introducción a Numpy por Bryan Van De Ven: si no conoces absolutamente nada de Numpy esta es tu charla. Da un repaso por las cosas más frecuentes del uso de Numpy sin meterse en cosas muy esotéricas. Puedes sacar la libreta e ir apuntando las cosas que creas que te puedan resultar útiles para tus análisis.

Pandas por Wes McKinney: Es una charla introductoria. El problema que veo es que Pandas no es algo tan centrado como Numpy con su ndarray, las posibilidades de uso son múltiples y, quizá, hacer algo introductorio en vídeo sobre Pandas no resulte tan sencillo como  hacerlo con Numpy. En general, la documentación de Pandas es aceptable (aunque incompleta en algunos momentos) y la veo como un buen punto de partida antes de empezar a ver vídeos sobre Pandas. Creo que lo mejor para empezar con Pandas es echarle un ojo al tour de 10 minutos en vídeo o en texto) y luego empezar a trastear con la librería y con la documentación para empezar a entenderlo. Por nuestra parte, estamos preparando nuestro tutorial cuyos primeros capítulos estaran disponibles en breve, stay tuned!!!! En esta conferencia ha habido más vídeos sobre Pandas pero son más avanzados (primero para marujear con datos de forma productiva, segundo (con numpy y statsmodels) para análisis de series temporales) .

Aprendiendo Python por Peter Norvig: Otro tutorial más para empezar con Python!!

Hacer bonitos gráficos con MatPlotLib por Mike Müller: Otro más avanzado muestra como hacer MatPlotLib más interactivo gracias al gran Jake Vanderplas. Os dejamos aquí nuestro tutorial de matplotlib por si alguno no lo conoce aún (#autobombo).

Visualización de datos con NodeBox por Lynn Cherny: Librería para hacer gráficos más 'artísticos'. Yo tengo sentimientos encontrados con algunos enfoques de este tipo de gráficos (NodeBox, D3,...) por lo que te recomiendo mejor verlo y, si alguien quiere, lo discutimos en los comentarios.

Scikit-image por Davin Potts: Creo que esta librería es una de las grandes desconocidas y ofrece unas posibilidades muy interesantes. Si no la conoces deberías echarle un ojo al vídeo.

Entre las que hablan sobre cosas más prácticas y no específicamente de librerías destacaría (alguna no porque me haya gustado especialmente):

Análisis de redes sociales por Katherine Chuang: Estas están muy de moda (teoría de grafos) y están empezando a ser aburridas si no muestran algo excepcional o no sacan conclusiones **medibles** de todo el análisis chachiguay que hacen. Usa NetworkX, también muy de moda.

Plataforma de datos espacio temporales para el océano por André Karpistsenko: Esta me ha parecido interesante ya que muestra todo el pifostio de tecnologías y trabajo que hay detrás de muchas webs a las que voy a descargarme datos para mis análisis.

Hay más charlas avanzadas que hablan de HDF5 ([1]), Machine Learning ([1], [2], [3]), Blaze (el futuro de Numpy), IPython y más cosas del Big Data y herramientas Python para lidiar con ello.

Si le echáis un ojo a algún vídeo, por favor, dejad algún comentario más abajo para saber lo que os ha parecido.

Saludos y espero veros pronto entre esa gran cantidad de datos :-P

Repaso a la PyConUS 2013

En nuestro repaso habitual a la parte científica de conferencias pythonistas importantes hoy le toca el turno a la última PyConUS celebrada en California la semana pasada:

Server log analysis with pandas (Taavi Burns): Ejemplos de uso de Pandas y las bondades de esta librería (a la que en breve le daremos un repaso importante). Si no conocéis Pandas es una buena forma de ver un poco tiempo muchas de sus ventajas. También se usa IPython y Matplotlib de forma general en la charla.

Building full-stack applications in Python (Luke Lee): En esta charla se echa un vistazo a todas las librerías 'científicas' masivas (Numpy and friends) que tenemos en Python. No aporta mucho si ya conoces un poco el ecosistema Numpy-científico. Como punto exótico, el uso de PyQwt en lugar de Matplotlib. Una librería gráfica más ligera que Matplotlib (y más fea, en mi humilde y subjetiva opinión).

Building an image processing pipeline with python (Franck Chastagnol): Un ejemplo de uso de Python en data-mining y en reconocimiento de caracteres con Numpy, openCV y Tesseract OCR (una librería en c++.

Crypto 101 (Laurens Van Houtven): Introducción a la criptografía, un poquito de matemáticas no hacen daño a nadie.

Cython Vs SWIG, Fight! (Mark Kohler): Acelerando (tus cálculos), que es gerundio.

Location, location, location (Julia Grace): Uso de bases de datos espaciales junto con GeoDjango. Ejemplos de uso y lecciones aprendidas.

MTO On Blast: Using Python's Natural Language Toolkit to Model Gossip Blogs (Robert Elwell): Lingüística computacional y procesamiento de lenguaje natural usando la librería NLTK (algún día me gustaría tener tiempo para echarle un ojo a NLTK,...).

Realtime Tracking and Mapping of Geographic Objects using Python (Ragi Burhum): Si tienes algún interés en montar un servicio de mapas, geolocalización, etc, esta charla te puede guiar un poco. Pero no se habla gran cosa de GIS.

Teaching with the IPython notebook (Matt Davis): Nada que decir, mejor verlo si tienes que dar un tutorial de algo. Enseña el uso de ipythonblocks, herramienta inventada por el mismo Matt Davis.

Functional programming with Python (Mike Müller): Si te interesa la programación funcional y quieres hacerlo con python puedes echarle un ojo a este vídeo.

Awesome big data algorithms (Titus Brown): Un poco sobre el nuevo término de moda: Big data. Generamos información por encima de nuestras posibilidades.

Fighting cancer with Python (Erik Evensen): Un ejemplo genial del uso de python para resolver problemas médicos como el cáncer (con un pequeño homenaje a John Hunter, creador de Matplotlib, que nos dejó el pasado verano debido a un cáncer).

Music Theory and Performance Analysis with Sebastian and Czerny (James Tauber): No la he vista en detalle por lo que no la puedo comentar mucho.

SimpleCV - Computer vision using python (Katherine Scott): Un repaso a simpleCV si no lo conoces.

Visualizing Github, Part I: Data to information (Idan Gazit y Dana Bauer), Visualizing Github, Part I: information to mining (Idan Gazit y Dana Bauer): No las he pedido ver, las tengo como deberes de vuelta de vacaciones.

Advanced Machine learning with scikit-learn (Olivier Grisel): Aprendizaje automático con uno de los desarrolladores de la excepcional librería scikit-learn.

Analyzing social networks with python (Kouznetsov, Kazil y Tsvetovat): Data mining (para conocerte y venderte cosas que no necesites,...).

Como charlas curiosas y/o interesantes:

Using Python to Code by Voice (Tavis Rudd): Mejor verla, aviso que tiene algún momento surrealista :-)

Python's class development toolkit (Raymond Hettinger): Esta es una charla must-see.

Transfirmong code into beautiful idiomatin python (Raymond Hettinger): Otra charla del mismo tipo que no te puedes perder.

El resto de vídeos los tenéis en PyVideo, como siempre.

Saludos.

Pybonacci estrena canal en Youtube

¡Saludos a todos! Hoy os traemos una entrada informativa sobre otro de los horizontes que hemos abierto en Pybonacci. En vista de que a algunos de los que escribimos aquí nos llama la atención la creación de animaciones para la visualización de problemas físicos, ¡hemos creado el canal de YouTube de Pybonacci!

http://www.youtube.com/user/Pybonacci

Ya lleva activo unas semanas, y en él iremos colgando vídeos y animaciones que vayamos creando. De momento podéis ver estas tres animaciones creadas con matplotlib y ffmpeg. Si quieres iniciarte en matplotlib, ya sabes que puedes empezar por la primera parte de nuestro manual de introducción a matplotlib.

Péndulo esférico

Péndulo de Foucault

Ecuación del calor

Os recordamos que aceptamos sugerencias de todo tipo, vía los comentarios en el blog, nuestra cuenta de Twitter, nuestro muro en Facebook o nuestro perfil en Google+, además de nuestro reciente canal en Youtube. Muchas gracias al resto de autores del blog y a todos los que nos visitáis cada día y nos animáis para que este proyecto crezca más y más :)

¡Un saludo!

Videos interesantes de la PyCon US 2012

Ya se ha celebrado la PyCon US de este año con una gran presencia de videos relacionados directamente con el uso de python para tareas de ciencia. Podéis encontrar tutoriales de iniciación a Matplotlib, análisis de datos (estadística , análisis de datos, aprendizaje automático,...[1], [2], [3], [4], [5], [6], [7],...), almacenamiento de datos usando HDF5 y PyTables, mapeo y SIG (Sistemas de Información Geográfica o GIS por sus siglas en inglés, Geographical Information Systems, [1], [2], [3], [4],...), uso de Ipython ([1], [2]), SAGE,...

Todos los videos de las charlas, tutoriales, sesión de posters,..., los podéis encontrar en:

http://pyvideo.org/category/17/pycon-us-2012

Viendo la gran presencia que ha tenido la ciencia este año en la PyCon US podría decirse que el presente y futuro de python en este campo parece muy prometedor.

Debido a la gran cantidad de información que hay y al poco tiempo disponible si algún video os resulta especialmente interesante comentadlo por aquí para que, en caso de no haberlo visto, le podamos echar un vistazo.

¡Que los disfrutéis!

Videos del PyData Workshop

Hace unas pocas semanas se celebró el taller PyData en las oficinas de Google en Mountain View. Por supuesto, se grabaron las charlas/presentaciones y están disponibles en el siguiente enlace (si falta alguna charla las irán ir añadiendo poco a poco).

Aquí os dejamos uno de los videos: Python in Big Data with an overview of NumPy & SciPy (Python en Big Data con un vistazo a Numpy y Scipy) por Travis Oliphant (creador de Numpy)

Espero que os resulte interesante.