XML auslesen

    Diese Seite verwendet Cookies. Durch die Nutzung unserer Seite erklären Sie sich damit einverstanden, dass wir Cookies setzen. Weitere Informationen

    Unsere Datenschutzerklärung wurde aktualisiert. Mit der Nutzung unseres Forums akzeptierst Du unsere Datenschutzerklärung. Du bestätigst zudem, dass Du mindestens 16 Jahre alt bist.

    • Hallo Forum,

      ich habe bisher gar keine Ahnung von Programmieren; ich möchte mir aber einfache Sachen beibringen. Beispielsweise das Auslesen einer XML im Zuge einer Datenanalyse:

      Die besagte XML befindet sich auf der Seite des Deutschen Bundestages und beinhaltet die Stammdaten aller Politiker. Hier der Link: bundestag.de/blob/472878/e207a…8/mdb-stammdaten-data.zip

      Mein Ziel ist eine Excel-Datei, welche mir alle Daten hinter einen Namen auflistet; also bspw. 1. Zelle: Name 2. Zelle: Vorname 3. Zelle: Geschlecht 4. Zelle: Geburtsjahr etc.
      Ich habe schon relativ viel im Netz recherchiert, aber ich weiß nicht so recht, wie ich anfangen soll. Der Excel-Import bringt mir nichts und zweitens möchte ich - wie gesagt - wissen, wie ich diese Daten via Programmierung extrahieren kann.

      Daher die Fragen:
      Welches Programm benötige ich für die Programmierung?
      Wie gehe ich vor?
      Was sind die Basics?
      Benötige ich mehr als die Basics, um meinem Ziel näher zu kommen?

      Danke!
    • Hi 0101,
      als Programmiersprache könntest du das sehr leicht erlernbare xProfan nehmen. Dafür gibt es hier sogar ein spezielles Unterforum.
      Auf der Seite des Entwicklers hast du dann die Möglichkeit, zum reinschnuppern eine ältere Version kostenlos runterzuladen oder eine aktuelle Free-Version.

      Dein Anliegen wär dafür ein wirklich schönes Start-Projekt. Da xml ja textbasiert ist, kannst du dir die Struktur in Ruhe anschauen, dann mit XProfan entsprechend einlesen und als einfache .csv-Datei abspeichern. (So würd ich das jetzt machen)
      Die läßt sich ja mit Excel problemlos öffnen. Oder du verarbeitest sie gleich in XProfan weiter - je nachdem, was du damit vor hast.

      Eine gewisse Einarbeitungszeit wirst du allerdings schon brauchen. XProfan ist jedoch relativ schnell erlernbar und es gibt hier und auch im offiziellen Forum genug Hilfe von netten "XProfanern" und ein deutsches Handbuch.

      XProfan hätte für dieses Projekt alle Mittel an Bord.
      Wenn du erstmal die .xml-Struktur durchschaut hast und weißt, wie du mit XProfan Textdateien einlesen und bearbeiten kannst, wirst du sicherlich schnell Spaß daran finden und relativ schnell erste Erfolge erzielen.

      Sehr Hilfreich ist das beiliegende deutsche Handbuch, mit dem du direkt loslegen kannst und wie oben bereits erwähnt, auch Hilfe von anderen Profanern bekommst, wenn's mal nicht so funktioniert, wie gedacht.

      Dein größter Feind wäre in diesem Fall Ungeduld oder Zeitmangel, weil das z.B. in einer Woche fertig sein soll o.ä.

      PS: Für dieses Projekt könntest du wahscheinlich so ziemlich jede Programmiersprache nehmen. Ich empfehle dir deshalb XProfan, weil ich irgendwann etwas suchte, um (ähnlich wie du) etwas lösen wollte und es damit wirklich einfach hingekriegt habe und bis heute alles mögliche damit programmiere :-)
      Gruß Jörg

      Ideen gibt es viele - man muß sie nur haben...
      XProfan X2.1, X3.1, X4.1 - XP-Pro SP2/3 & W7-Pro 64 - Mint Mate, AntiX
    • meierkurt schrieb:

      Man sollte auch nicht sofort mit XML anfangen.
      Wohl war!

      Des weiteren würde ich nicht gerade XProfan für xml empfehlen, obwohl es zur Not wohl funktioniert.

      Hier mal ein Link zu XML: de.wikipedia.org/wiki/Extensible_Markup_Language

      Als Einsteigersprache mit XML-Unterstützung würde ich z.B. PureBasic empfehlen. Die enthält eine XML-Bibliothek (expat.sourceforge.net/).
      Gruß Thomas

      "Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen – Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen."
      ComputerInfo für PPF
    • PureBasic ist natürlich auch eine gute Option.
      Da ist sicherlich die XML-Bibliothek hilfreich. Hatte ich jetzt aktuell gar nicht auf dem Schirm...
      Ich sollte mal wieder etwas mehr in PureBasic machen ;-)

      Mit XProfan ist sicherlich mehr Handarbeit notwendig.
      Hab mir mal eben so eine xml-Datei angeschaut und fand den Aufbau jetzt nicht sooo kompliziert. Obwohl mir dieses Format nicht gerade sympathisch ist.
      Das läßt sich mit den vorhandenen Stringbefehlen und den anderen üblichen Grundbefehlen gut einlesen & verarbeiten, wenn man den Aufbau durchschaut hat. Es soll ja in diesem Fall ja keine XML erzeugt werden.

      Ich persönlich habe mit xml-Dateien bis jetzt noch nichts zu tun gehabt.


      meierkurt schrieb:

      Man sollte auch nicht sofort mit XML anfangen.
      Nun ja - was willst machen, wenn es das Problem ist, was aktuell gelöst werden soll.
      Kannst dir ja nicht einfach erstmal paar andere Probleme suchen.
      Mein erstes Problem hatte damals mit dBase zu tun (0 Ahnung) und habe dann das nötige drumherum (also die Basics) automatisch mitgelernt.
      Gruß Jörg

      Ideen gibt es viele - man muß sie nur haben...
      XProfan X2.1, X3.1, X4.1 - XP-Pro SP2/3 & W7-Pro 64 - Mint Mate, AntiX

      Dieser Beitrag wurde bereits 2 mal editiert, zuletzt von JörgG ()

    • XML ist doch zweitrangig. Beim Programmieren braucht man erst mal Grundlagen. Ist doch Unsinn, sich sofort auf XML zu konzentrieren.

      Zumindest wie man mit Basics einen Programmablauf gestaltet, das MUSS man wissen. Und was für Datentypen inkl. Listen es gibt, das sollte man schon wissen.

      XML soll ja nicht auf die lange Bank, aber das kann nicht der direkte Einstieg sein.
    • JörgG schrieb:

      Das läßt sich mit den vorhandenen Stringbefehlen und den anderen üblichen Grundbefehlen gut einlesen & verarbeiten,
      Daran sieht man, das Du noch nie was mich XML gemacht hast :-D
      PureBasic enthält alleine über 50 Befehle zum XML Parsen. Wenn Du durch ein einfaches XML Iterierst und alle Knoten und deren ganzen Attribute auslesen willst, nur mit Stringbefehlen, dann viel Spaß :lol:
      Gruß Thomas

      "Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen – Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen."
      ComputerInfo für PPF
    • ts-soft schrieb:

      PureBasic enthält alleine über 50 Befehle zum XML Parsen. Wenn Du durch ein einfaches XML Iterierst und alle Knoten und deren ganzen Attribute auslesen willst, nur mit Stringbefehlen, dann viel Spaß
      ok - ich gebe zu, daß ich die Komplexität auf Grund meiner fehlenden XML-Erfahrung wohl doch etwas unterschätzt hab :8O:
      Ich habe jetzt irgendeine einfache xml-Datei genommen, deren Aufbau angeschaut und hätte genau für dieses XML zugeschnitten sozusagen eine Einleseroutine gebaut. (soweit mein unbeschwert-optimistischer Plan ;-) )
      Natürlich funktioniert das dann auch nur für diese eine XML-Struktur...

      Aber gut - ich sehe ein, daß eine direkte XML-Unterstützung natürlich vorzuziehen ist.

      OT:
      Ehrlich gesagt, verstehe ich nicht, weshalb man Daten so umständlich via XML speichern soll.
      Wozu hat man das denn erfunden?
      Mit CSV geht das leichter & ist übersichticher. Und ist deutlich kleiner als XML (bei gleicher Datenmenge).
      /OT
      Gruß Jörg

      Ideen gibt es viele - man muß sie nur haben...
      XProfan X2.1, X3.1, X4.1 - XP-Pro SP2/3 & W7-Pro 64 - Mint Mate, AntiX

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von JörgG ()

    • JörgG schrieb:

      Ehrlich gesagt, verstehe ich nicht, weshalb man Daten so umständlich via XML speichern soll.
      Ist ja hauptsächlich für komplexe Strukturen. Für einfachere Dinge nimmt man JSON.

      CSV ist übrigens nicht so das wahre. Das Format muss ja auch jedes mal neu definiert werden, weil es z.B. keine genormten Trenner gibt. Im Grunde ist eigentlich nichts vorgeschrieben, weil selbst das "Comma Separate Value" könnte ein Semikolon sein :-D und weitere Datentypen sind auch kaum möglich. Ist also nur eine Textdatei in einem noch zu definierendem Format.
      Gruß Thomas

      "Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen – Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen."
      ComputerInfo für PPF
    • Geht es darum, die XML-Dateien aus dem Internet downloaden zu können? Dazu reicht XProfans Download-Befehl (Demo-Beispiel in der Hilfe). Excel kann XML-Dateien an sich schreiben und einlesen, OpenOffice Calc ebenfalls. Ob der Import fremder XML-Dateien gelingt, hängt vermutlich nur davon ab ob diese XML-Datei in einem Biundestags- oder EU-Büro mit Excel erstellt wurden.

      EDIT: Ich komme gerade darauf, daß die in der obigen Anfrage angegebene Internetadresse ohnhin eine gezippte XML samt DTD-Strukturdatei liefert. Dann sollte es nicht schwer sein, ein Filter zu bauen, daß eine CSV-Dateii schreibt. Diei kann dann in Excel eingelesen werden. Momentan nur ein Zeitproblem - mal sehen.
      Gruss

      Dieser Beitrag wurde bereits 6 mal editiert, zuletzt von p. specht ()

    • ÄCHZ... das Ding hat 10 MB ... Besteht eigentlich die Erlaubnis, das Zeug zu konvertieren? (Strengerer Datenschutz besonders von Datenbanken!)

      EDIT: Da hab ich mich aber weit überschätzt! Was mir mit HTML leicht gelungen ist, bei 10 MB XML Datenbanken mit ZIG Begriffen und Hirarchien, Wiederholungen etc beisse ich mir gerade die Zähne aus. XML-Notepad hilft auch nicht, weil es keine Fremd-Exportformate bietet. Ist aber als fast einziges Free ...

      Grausam, das Hobby-Programmiererleben ...

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von p. specht ()

    • Wieso enthält die XML-Datei nur 704 Abgeordnete der 19. Wahlperiode? Das sollten lt. Wiki doch 711 sein, lt. Bundestags-Homepage 709. Da fehlen mindestens 4 Männer und 1 Frau! OK, einer ist 2017 verstorben, aber werden solche Mandate und die Pensionierungen nicht nachbesetzt?

      Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von p. specht ()

    • p. specht schrieb:

      Wieso enthält die XML-Datei nur 704 Abgeordnete der 19. Wahlperiode?
      hast du das soweit schon mit Profan gemacht?

      Hab das Ding heut auch mal runtergeladen - konnte dem Spieltrieb einfach nicht widerstehen ;-)
      Einlesen und Mitglieder zählen geht schon mal.
      Sind insgesamt 4073 Mitglieder (hoffentlich liege ich da richtig)- weiter bin ich noch nicht...
      Gruß Jörg

      Ideen gibt es viele - man muß sie nur haben...
      XProfan X2.1, X3.1, X4.1 - XP-Pro SP2/3 & W7-Pro 64 - Mint Mate, AntiX
    • Für privat kein Problem. Aber wir leben in eigenartigen Zeiten, mit eigenartigen Leuten, die eigenartige Ziele verfolgen. Und anderen Leuten, die den Leuten mit den eigenartigen Zielen auf den Fersen sind und wissen wollen was die so alles klicken. Und die sich was zusammenreimen, auch wenn´s nicht stimmt. Eigenartig ...
    • p. specht schrieb:

      Für privat kein Problem. Aber wir leben in eigenartigen Zeiten...
      Schon klar. ;-)
      Mich interessiert nur aus Programmierer-Sicht die technische Umsetzung - also ob ich in einer überschaubaren Zeit so ein XML-Dokument mit XProfan verarbeiten kann. Nenn es einfach Sportsgeist oder Neugier :-)

      Der Inhalt ist für mich in diesem Fall nebensächlich. Das Teil ist schon eine Herausforderung - mal schaun, ob ich daraus eine brauchbare CSV generieren kann.

      Das gleiche will ich dann nur so aus Spaß und zum Vergleich mit Purebasic machen. Was immer dabei rum kommt (oder auch nicht) - dümmer kann ich davon nicht werden... :-)

      Technische Sachen im Detail möchte ich ja auch hier nicht weiter vertiefen - dafür gibt es ggf. die passenden Foren.
      Gruß Jörg

      Ideen gibt es viele - man muß sie nur haben...
      XProfan X2.1, X3.1, X4.1 - XP-Pro SP2/3 & W7-Pro 64 - Mint Mate, AntiX
    • JörgG schrieb:

      ob ich daraus eine brauchbare CSV generieren kann.
      Ich denke mal nicht, das man mit CSV alles darstellen kann :-D , aber für einfachere Dateien wird es wohl gehen. Ansonsten wären ein BinaryTree das richtige. Aber zum Darstellen weniger geeignet.
      Gruß Thomas

      "Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen – Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen."
      ComputerInfo für PPF
    • ts-soft schrieb:

      Ich denke mal nicht, das man mit CSV alles darstellen kann...
      Jo - zumindest für diese (Monster-) XML seh ich das mittlerweile auch so. Definitiv nicht in einer einzigen CSV.
      Vllt. wären mehrere CSV ein Ansatz. Also gewissermaßen die Hauptkategorien mit den vielen Unterkategorien in je eine CSV packen.
      Oder halt von vornherein nur bestimmte Elemente verarbeiten - also nur die, die von Interesse sind.

      Aber vermutlich hat der Thread-Ersteller inzwischen das Handtuch geworfen ;-)

      p. specht schrieb:

      XProfan kann doch jetzt auch JSON. Das müsste relativ leicht umzusetzen sein...
      Darin bin ich genauso "grün", wie in XML. Aber immerhin - wär eine Option.
      "...relativ leicht..." ist wirklich treffend ausgedrückt :-)
      Gruß Jörg

      Ideen gibt es viele - man muß sie nur haben...
      XProfan X2.1, X3.1, X4.1 - XP-Pro SP2/3 & W7-Pro 64 - Mint Mate, AntiX
    • JörgG schrieb:

      Vllt. wären mehrere CSV ein Ansatz.
      Wie wäre es mit einem Treeview (ich hoffe mal, das heißt so in XProfan)? Das kommt einer XML-Datei noch am ehesten, wenn man diese darstellen möchte.
      Gruß Thomas

      "Die deutsche Rechtschreibung ist Freeware, du darfst sie kostenlos nutzen – Aber sie ist nicht Open Source, d. h. du darfst sie nicht verändern oder in veränderter Form veröffentlichen."
      ComputerInfo für PPF