Die Internet Movie Database (IMDb) ist die größte Online-Datenbank mit Informationen zu Filmen, Fernsehserien, Heimvideos, Videospielen und Streaming-Inhalten. Die Online-Datenbank enthält Millionen von genauen Datensätzen, die Sie zur Durchführung von Datenanalysen verwenden können.

Cinemagoer (früher bekannt als IMDbPY) ist eine Python-Bibliothek zum Verwalten und Abrufen der Daten der IMDb-Filmdatenbank. Sie können auf Daten zu Filmen, Personen und Unternehmen zugreifen, die für weitere Analysen verwendet werden können.

Erforderliche Bibliotheken installieren

Sie müssen die installieren Kinogänger Python-Bibliothek für den Zugriff auf die IMDb Datenbank. Führen Sie den folgenden Befehl in der Eingabeaufforderung aus, um die Bibliothek zu installieren:

Pip Installieren Kinogänger

Du musst haben pip auf Ihrem System installiert um externe Python-Bibliotheken zu installieren.

Der in diesem Projekt verwendete Code ist in a GitHub-Repository und steht Ihnen unter der MIT-Lizenz kostenlos zur Verfügung.

instagram viewer

Extrahieren von IMDb-Daten mit Python

Sie müssen die Cinemagoer-Bibliothek importieren, bevor Sie sie in Ihrem Code verwenden können.

aus imdb importieren Kinogänger
ia = Kinogänger()

Der obige Code importiert die Cinemagoer-Bibliothek und erstellt eine Instanz der Cinemagoer-Klasse.

Filme suchen

Sie können mithilfe von nach Filmen mit einem bestimmten (oder ähnlichen) Titel suchen search_movie() Methode. Wenn Sie beispielsweise nach Filmen mit dem Titel „Rock“ suchen möchten, müssen Sie den folgenden Code ausführen:

aus imdb importieren Kinogänger

# Erstellen einer Instanz der Cinemagoer-Klasse
ia = Kinogänger()

# Suche nach Filmen, die Rock im Namen haben
Filme = ia.search_movie('Felsen')
drucken(Filme[0])

Dies sollte den ersten gefundenen Film ausdrucken, zum Beispiel:

Sie können einen Film anhand seiner IMDb-ID abrufen. Sie können dann weitere Informationen wie Regisseurnamen und Genres extrahieren. Du brauchst Schleife durch die Liste um individuelle Informationen zu erhalten.

aus imdb importieren Kinogänger

# Erstellen einer Instanz der Cinemagoer-Klasse
ia = Kinogänger()

# Abrufen des Films nach IMDb-ID
movie = ia.get_movie('0468569')
drucken(Film)

# Drucken der Namen der Regisseure des Films
drucken('Direktoren:')

für Regisseur im Film['Direktoren']:
Druck (Regisseur['Name'])

# Drucken der Genres des Films
drucken('Genres:')

für Genre im Film['Genres']:
drucken(Genre)

In der Ausgabe sollten Sie den Namen des angegebenen Films, seine(n) Regisseur(e) und sein(e) Genre(s) sehen:

Suche nach einer Person

Sie können mithilfe von nach Personen suchen Suchperson() Methode. Wenn Sie beispielsweise nach "Heath" suchen möchten, müssen Sie den folgenden Code ausführen:

aus imdb importieren Kinogänger

# Erstellen einer Instanz der Cinemagoer-Klasse
ia = Kinogänger()

# Suche nach Personen, die Heath in ihrem Namen haben
Personen = ia.search_person('Heide')
drucken(Personen[0])

Sie sehen den Namen der ersten übereinstimmenden Person, die die Suche findet:

Unternehmen suchen

Sie können mit der nach Unternehmen suchen search_company() Methode. Wenn Sie beispielsweise nach „Universal“ suchen möchten, müssen Sie den folgenden Code ausführen:

aus imdb importieren Kinogänger

# Erstellen einer Instanz der Cinemagoer-Klasse
ia = Kinogänger()

# Suche nach Unternehmen, die Universal in ihrem Namen haben
Firmen = ia.search_company('Universal')
drucken(Firmen)

Sie erhalten eine Liste aller Unternehmen, die Universal in ihrem Namen haben.

Sie können auch Personen- und Firmendaten anhand ihrer ID abrufen.

aus imdb importieren Kinogänger

# Erstellen einer Instanz der Cinemagoer-Klasse
ia = Kinogänger()

# Personendaten nach ID abrufen
person = ia.get_person('0005132')
drucken (Person['Name'])
drucken (Person['Geburtsdatum'])

# Unternehmensdaten nach ID abrufen
Firma = ia.get_company('0005073')
drucken (Firma['Name'])

Die Ausgabe zeigt Details zur Person und den Namen eines Unternehmens:

Top- und Bottom-Filme finden

Sie können die Daten für die besten 250 und die schlechtesten 100 Filme mit abrufen get_top250_movies() Und get_bottom100_movies() Methoden bzw.:

aus imdb importieren Kinogänger

# Erstellen einer Instanz der Cinemagoer-Klasse
ia = Kinogänger()

# Suche nach den 250 besten Filmen
top = ia.get_top250_movies()
drucken(Spitze[0])

# Die 100 schlechtesten Filme finden
unten = ia.get_bottom100_movies()
drucken(Unterseite[0])

Als Antwort sehen Sie den Namen des besten Films und den Namen des schlechtesten:

Die Kinobesucher-Bibliothek bietet auch einige andere Methoden wie z get_top250_tv(), get_popular100_movies(), Und get_top250_indian_movies().

Datenanalyse ist die Auswertung von Daten mit analytischen oder statistischen Werkzeugen zur Gewinnung von Informationen. Die Popularität der Datenanalyse wächst täglich. Es wird jetzt von Unternehmen, Marketingfirmen und Sportteams verwendet. Der vollständige Prozess der Datenanalyse umfasst das Definieren von Zielen, das Stellen von Fragen, das Sammeln von Daten, das Bereinigen von Daten, die Datenanalyse und das Abschließen von Ergebnissen.

Sie können Datensätze für Ihre Projekte mit Python-Bibliotheken wie Cinemagoer oder über Online-Plattformen wie Kaggle abrufen. Neben vollständigen Sprachen wie Python und R können Sie andere Tools wie Microsoft Excel, Tableau und Stata verwenden, um Datenanalysen durchzuführen.