Instagram ist eine der beliebtesten Social-Media-Sites mit Milliarden von Nutzern. Jeder, von Studenten bis zu Prominenten, hat Instagram-Konten. Die öffentlichen Daten von Instagram können für Unternehmen, Vermarkter und Einzelpersonen von immensem Wert sein. Jeder kann diese Daten verwenden, um Datenanalysen durchzuführen, gezieltes Marketing durchzuführen und Erkenntnisse zu gewinnen.

Sie können Python verwenden, um ein automatisiertes Tool zu erstellen, das Instagram-Daten extrahiert.

Erforderliche Bibliotheken installieren

Installloader ist eine Python-Bibliothek, mit der Sie öffentlich verfügbare Daten aus Instagram extrahieren können. Sie können auf Daten wie Bilder, Videos, Benutzername, Nr. zugreifen. von Beiträgen, Anzahl der Follower, Anzahl der Follower, Bio usw. mit Instaloader. Beachten Sie, dass Instaloader in keiner Weise mit Instagram verbunden ist, autorisiert, gepflegt oder unterstützt wird.

Führen Sie den folgenden Befehl aus, um den Instaloader über Pip zu installieren:

instagram viewer
Pip Installieren Installloader

Du musst haben pip auf Ihrem System installiert um externe Python-Bibliotheken zu installieren.

Als nächstes müssen Sie die Pandas-Python-Bibliothek installieren. Pandas ist eine Python-Bibliothek, die hauptsächlich zur Datenmanipulation und Datenanalyse verwendet wird. Führen Sie den folgenden Befehl aus, um es zu installieren:

Pip Installieren Pandas

Jetzt können Sie mit dem Einrichten des Codes und dem Abrufen der Daten aus Instagram beginnen.

Einrichten Ihres Codes

Um das Tool zum Abrufen von Instagram-Daten einzurichten, müssen Sie die Instaloader-Python-Bibliothek importieren und eine Instanz der Instaloader-Klasse erstellen. Danach müssen Sie das Instagram-Handle des Profils angeben, aus dem Sie die Daten extrahieren möchten.

Der Python-Code des Instagram-Extraktors ist verfügbar in a GitHub-Repository und steht Ihnen unter der MIT-Lizenz kostenlos zur Verfügung.

importieren Installloader

# Erstellen einer Instanz der Instaloader-Klasse
bot = Installloader. Installloader()

# Laden des Profils von einem Instagram-Handle
Profil = Installloader. Profile.from_username (bot.kontext, 'Cristiano')
drucken(Profil)

Dies ist ein guter erster Schritt, um die Grundlagenarbeit zu überprüfen. Sie sollten einige aussagekräftige Daten ohne Fehler sehen:

Extrahieren von Daten aus dem Profil

Sie können wertvolle öffentlich verfügbare Daten wie Benutzername, Nr. von Beiträgen, Anzahl der Follower, Anzahl der Follower, Bio, Benutzer-ID und externe URL mit Instaloader mit nur wenigen Codezeilen. Sie müssen nur das Instagram-Handle des Profils angeben.

importieren Installloader
importieren Pandas als pd

# Erstellen einer Instanz der Instaloader-Klasse
bot = Installloader. Installloader()

# Laden eines Profils von einem Instagram-Handle
Profil = Installloader. Profile.from_username (bot.kontext, 'Leomessi')
drucken("Nutzername: ", Profil.Benutzername)
drucken("Benutzer-ID: ", Profil.Benutzer-ID)
drucken("Anzahl der Beiträge: ", profil.mediacount)
drucken("Anzahl der Follower: ", Profil.Follower)
drucken("Folgende Zählung: ", Profil.Followees)
drucken("Bio: ", Profil.Biographie)
drucken("Externe URL: ", Profil.externe_URL)

Sie sollten viele Profilinformationen von dem von Ihnen angegebenen Handle sehen:

Extrahieren von E-Mails aus Bio

Sie können E-Mail-Adressen aus der Insta-Bio eines beliebigen Profils extrahieren Reguläre Ausdrücke. Sie müssen die Pythons importieren Betreff Bibliothek und übergeben Sie den regulären Ausdruck zur Validierung der E-Mail als Parameter an die re.findall() Methode:

importieren Installloader
importieren Betreff
# Erstellen einer Instanz der Instaloader-Klasse
bot = Installloader. Installloader()
Profil = Installloader. Profile.from_username (bot.kontext, "Vermögen")
drucken("Nutzername: ", Profil.Benutzername)
drucken("Bio: ", Profil.Biographie)
emails = re.findall (r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", Profil.Biographie)
print("E-Mails extrahiert aus die bio :)
drucken(E-Mails)

Das Skript druckt alles, was es als E-Mail-Adresse in der Biografie erkennt:

Extrahieren von Top-Suchergebnisdaten

Wenn Sie auf Instagram nach irgendetwas suchen, erhalten Sie mehrere Ergebnisse, darunter Benutzernamen und Hashtags. Sie können die Top-Suchergebnisse mit extrahieren get_profiles() Und get_hashtags() Methoden. Sie müssen nur die Suchanfrage in der angeben Installloader. TopSearchResults() Methode. Außerdem können Sie die einzelnen Ergebnisse iterieren und drucken/speichern.

importieren Installloader

# Erstellen einer Instanz der Instaloader-Klasse
bot = Installloader. Installloader()

# Geben Sie hier die Suchanfrage ein
search_results = Installloader. TopSearchResults (bot.context, 'Musik')

# Durchlaufen der extrahierten Benutzernamen
fürNutzernameInSuchergebnisse.get_profiles():
drucken(Nutzername)

# Iteration über die extrahierten Hashtags
fürHashtagInSuchergebnisse.get_hashtags():
drucken(Hashtag)

Die Ausgabe enthält alle übereinstimmenden Benutzernamen und Hashtags:

Extrahieren von Followern und Followern eines Kontos

Sie können die Follower eines Kontos und die, denen es selbst folgt, mit Instaloader extrahieren. Sie müssen einen Instagram-Benutzernamen und ein Passwort angeben, um diese Daten abzurufen.

Verwenden Sie niemals Ihre persönlichen Konten, um Daten von Instagram zu extrahieren, da dies dazu führen kann, dass Ihr Konto vorübergehend oder dauerhaft gesperrt wird.

Nachdem Sie eine Instanz der Instaloader-Klasse erstellt haben, müssen Sie Ihren Benutzernamen und Ihr Passwort angeben. Dadurch kann sich der Bot mit Ihrem Konto bei Instagram anmelden und die Follower- und Follower-Daten abrufen.

Als nächstes müssen Sie das Instagram-Handle des Zielprofils angeben. Der get_followers() Und get_followees() Methoden extrahieren die Follower und Followees. Sie können die Benutzernamen der Follower und Follower mithilfe von abrufen follower.benutzername Und followee.benutzername Eigenschaften bzw.

Wenn Sie die Ergebnisse in einer CSV-Datei speichern möchten, müssen Sie die Daten zunächst in ein Pandas DataFrame-Objekt konvertieren. Verwenden Sie die pd. DataFrame() -Methode zum Konvertieren eines Listenobjekts in einen DataFrame.

Schließlich können Sie das DataFrame-Objekt mithilfe von in eine CSV-Datei exportieren to_csv() Methode. Sie müssen die passieren Dateiname.csv als Parameter für diese Methode, um die exportierten Daten im CSV-Dateiformat zu erhalten.

Nur die Kontoinhaber können alle Follower und Follower sehen. Sie können mit dieser oder einer anderen Methode nicht alle Follower- und Follower-Daten extrahieren.

# Bibliotheken importieren
importieren Installloader
importieren Pandas als pd

# Erstellen einer Instanz der Instaloader-Klasse
bot = Installloader. Installloader()
bot.login (Benutzer="Dein Benutzername", Passwort="Ihr Passwort")

# Laden eines Profils von einem Instagram-Handle
Profil = Installloader. Profile.from_username (bot.kontext, 'Your_target_account_insta_handle')

# Abrufen der Benutzernamen aller Follower
followers = [follower.username für Follower in profile.get_followers()]

# Konvertieren der Daten in einen DataFrame
followers_df = pd. DataFrame (Follower)

# Speichern der Ergebnisse in einer CSV-Datei
followers_df.to_csv('followers.csv', Index=Falsch)

# Abrufen der Benutzernamen aller folgenden
followings = [followee.username für followee in profile.get_followees()]

# Konvertieren der Daten in einen DataFrame
followings_df = pd. DataFrame (folgend)

# Speichern der Ergebnisse in einer CSV-Datei
followings_df.to_csv('folgende.csv', Index=Falsch)

Laden Sie Beiträge von einem Instagram-Konto herunter

Auch hier müssen Sie zum Herunterladen von Beiträgen von einem beliebigen Konto einen Benutzernamen und ein Passwort angeben. Auf diese Weise kann sich der Bot mit Ihrem Konto bei Instagram anmelden. Sie können alle Daten der Beiträge mit abrufen get_posts() Methode. Und Sie können alle einzelnen Posts mit iterieren und herunterladen download_post() Methode.

# Bibliotheken importieren
importieren Installloader
importieren Pandas als pd

# Erstellen Sie eine Instanz der Instaloader-Klasse
bot = Installloader. Installloader()
bot.login (Benutzer="Dein Benutzername",passwort="Ihr Passwort")

# Laden eines Profils von einem Instagram-Handle
Profil = Installloader. Profile.from_username (bot.kontext, 'Your_target_account_insta_handle')

# Abrufen aller Posts in einem Objekt
Beiträge = profile.get_posts()

# Iterieren und Herunterladen aller einzelnen Posts
für index, post in enumerate (posts, 1):
bot.download_post (posten, Ziel=f"{profile.username}_{index}")

Scrape das Web mit Python

Data Scraping oder Web Scraping ist eine der häufigsten Methoden, um nützliche Informationen aus dem Internet zu extrahieren. Sie können die extrahierten Daten für Marketing, Inhaltserstellung oder Entscheidungsfindung verwenden.

Python ist die bevorzugte Sprache für das Data Scraping. Bibliotheken wie BeautifulSoup, Scrapy und Pandas vereinfachen die Extraktion, Analyse und Visualisierung von Daten.