hands-on workshop:
  coding for data-
    journalism
einsteigerfreundliche Software-Tools für
   die Beschaffung und Präsentation
            relevanter Daten
urs@opendata-network.org




http://opendata-network.org/
upcoming:
Open Data Hackday
http://opendata.hackday.net/
17. & 18. April 2010 (morgen! hier!)



Open Democracy Camp
http://tinyurl.com/opend
8. & 9. Mai - Berlin - (new thinking store?)




Daten-Journalismus in der Praxis
heute 17h - Blauer Saal - Lorenz Matzat
3 Beispiele:
Daten mit ruby
aus dem web
scrapen

Werte mit den
Google Chart Tools
visualisieren

Netzwerke mit
Gephi
visualisieren
• dynamische Skriptsprache
• leicht zu erlernen & ausdrucksstark
• http://www.ruby-lang.org/
• sudo apt-get install ruby irb ri rdoc rubygems
• sudo gem install nokogiri (Scraping-Library)
lets roll:




 Demo
tagesschau:




          Text aus einer
            HTML-Seite
             extrahiert 
tagesschau_fuer_nerds.rb




                           Demo
next step:




       HTML                      extrahierter    CSV
http://de.eurosport.yahoo.com
     /fussball/bundesliga/           Text       Tabelle
fussball.rb
fussball.rb




zeilen = Array = [zeile, zeile, zeile, zeile]
Zeile für Zeile
fussball.rb
Ergebnis




       HTML                     extrahierter    CSV
http://de.eurosport.yahoo.com
     /fussball/bundesliga/          Text       Tabelle
Nebeneinkünfte
       Stufe 1 für 1000 bis 3500 Euro,
       Stufe 2 für 3500 bis 7000 Euro,
       Stufe 3 für alles ab 7000 Euro.
       Die Stufen werden je nach Job
       monatlich oder jährlich ausgewiesen.

       Wer unter 1000 Euro im Monat oder
       10.000 Euro im Jahr bleibt, muss nichts
       melden; solche Tätigkeiten werden ohne
       Stufen-Angabe vermerkt
Strategie:
1.
Alle Biografie-URLs
ermitteln

2.
Angaben zu Jobs
auslesen

3.
Tabelle erstellen
1. Alle Biografie-URLs
2a. Name und Partei auslesen
2b. Nebeneinkünfte auslesen
3. Tabelle erstellen
lokale Kopien erstellen
    mit SiteSucker
Nebeneinkünfte




    Demo
Google Chart Tools
        http://chart.apis.google.com/chart?
chs=250x100&chd=t:60,40&cht=p3&chl=Hello|World




<img border="1"
  src="http://chart.apis.google.com/chart?chs=250x100&amp;chd=t: 60,40&amp;cht=p3&amp;chl=Hello|World"
  alt="Yellow pie chart">
Google Chart Tools

        http://chart.apis.google.com/chart?
chs=250x100&chd=t:60,40&cht=p3&chl=Hello|World

Bildgröße    Werte    Chart-Typ      Legende
Beispiele:
Google Visualization API




Javascript auf der Seite statt IMG-src-URL
Hands-on: Coding for Data-Journalism
Gephi
interactive visualization and exploration for graphes
Graph-Input-File (zB. gml)
Creator "ODN workshop"
graph
[
  node
  [
    id 1                  edge
    label "DoingIt Inc"    [
  ]                          source 2
  node                       target 1
  [                        ]
    id 2                   edge
    label "Proxy Inc."     [
  ]                          source 3
                             target 1
                           ]
Gephi




Demo

Weitere ähnliche Inhalte

PDF
3D in Photoshop
PDF
Comic: Die Neue
PDF
Spehr Eu Wahl 2009
PPTX
Examen profa anairis 2 Yoaltzin Antonio Sevilla San Agustin
PDF
PDF
Cuestionario de computacion
DOCX
Valores
PDF
Tercer solemne pauta-de_correcci_n
3D in Photoshop
Comic: Die Neue
Spehr Eu Wahl 2009
Examen profa anairis 2 Yoaltzin Antonio Sevilla San Agustin
Cuestionario de computacion
Valores
Tercer solemne pauta-de_correcci_n

Andere mochten auch (16)

PPTX
Visita a bilbao 3 ¦ diversificaci+ôn
KEY
Open Data Network: Warum eine freie Gesellschaft offene Daten braucht.
PDF
Título del documento
PDF
¿Qué tan verde es un experimento
PPTX
Introduccion a la programacion
PDF
SEPA Informationen aus dem Fundraising Frühstück-BITKOM
PPTX
Trabajo de realidad aumentada
PDF
Concepcion de las pilas galvanicas
PPTX
A pulir para que brille
DOC
Ejercicio: Cambio conceptual a través del analísis de las propiedades del agu...
PDF
Banale Musik erzeugt Provinz
PPTX
PPTX
Rene Barrientos - Matematicas - Nancy oña
PDF
Tabla periodica
PDF
Irisbond Primma Manual de Usuario
Visita a bilbao 3 ¦ diversificaci+ôn
Open Data Network: Warum eine freie Gesellschaft offene Daten braucht.
Título del documento
¿Qué tan verde es un experimento
Introduccion a la programacion
SEPA Informationen aus dem Fundraising Frühstück-BITKOM
Trabajo de realidad aumentada
Concepcion de las pilas galvanicas
A pulir para que brille
Ejercicio: Cambio conceptual a través del analísis de las propiedades del agu...
Banale Musik erzeugt Provinz
Rene Barrientos - Matematicas - Nancy oña
Tabla periodica
Irisbond Primma Manual de Usuario
Anzeige

Hands-on: Coding for Data-Journalism