Pandas ist eine Open-Source-Python-Bibliothek, die hauptsächlich zur Datenbearbeitung und -analyse verwendet wird. Es baut auf der NumPy-Bibliothek auf und bietet leistungsstarke, benutzerfreundliche Datenstrukturen und Datenanalysetools für die Programmiersprache Python.

In diesem Artikel erfahren Sie, wie Sie mit Pandas 6 grundlegende Operationen ausführen.

Verwendung von Pandas-Beispielen

Sie können die Beispiele in diesem Artikel mit Computernotizbüchern wie ausführen Jupyter-Notizbuch, Google Colab, etc. Sie können die Beispiele auch ausführen, indem Sie den Code im interaktiven Modus direkt in den Python-Interpreter eingeben.

Wenn Sie sich den vollständigen in diesem Artikel verwendeten Quellcode ansehen möchten, können Sie von hier aus auf die Python-Notebook-Datei zugreifen GitHub-Repository.

1. So importieren Sie Pandas als pd und drucken die Versionsnummer

Sie müssen die verwenden importieren Schlüsselwort zum Importieren einer beliebigen Bibliothek in Python. Pandas wird in der Regel unter dem importiert

instagram viewer
pd alias. Mit diesem Ansatz können Sie das Pandas-Paket als pd Anstatt von Pandas.

Pandas als pd importieren
drucken (pd.__version__)

Ausgabe:

1.2.4

2. So erstellen Sie eine Serie in Pandas

Pandas Series ist ein eindimensionales Array, das Daten jeglichen Typs enthält. Es ist wie eine Spalte in einer Tabelle. Sie können eine Reihe mit numpy Arrays, numpy Funktionen, Listen, Wörterbüchern, Skalarwerten usw. erstellen.

Die Werte der Reihe sind mit ihrer Indexnummer gekennzeichnet. Standardmäßig hat der erste Wert den Index 0, der zweite Wert den Index 1 und so weiter. Um Ihre eigenen Labels zu benennen, müssen Sie die Index Streit.

So erstellen Sie eine leere Serie

s = pd. Serie (dtype='float64')
S

Ausgabe:

Serie([], dtype: float64)

Im obigen Beispiel ist eine leere Reihe mit dem schweben Datentyp erstellt.

So erstellen Sie eine Serie mit NumPy Array

Pandas als pd importieren
numpy als np importieren
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
S

Ausgabe:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Verwandt: NumPy-Operationen für Anfänger

So erstellen Sie eine Serie mit Liste

d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
S

Ausgabe:

0 1
1 2
2 3
3 4
4 5
dtype: int64

So erstellen Sie eine Serie mit Index

Um eine Serie mit einem Index zu erstellen, müssen Sie die Index Streit. Die Anzahl der Indizes muss der Anzahl der Elemente in der Reihe entsprechen.

d = [1, 2, 3, 4, 5]
s = pd. Reihe (d, index=["eins", "zwei", "drei", "vier", "fünf"])
S

Ausgabe:

eins 1
zwei 2
drei 3
vier 4
fünf 5
dtype: int64

So erstellen Sie eine Serie mit Wörterbuch

Die Schlüssel des Wörterbuchs werden zu den Labels der Reihe.

d = {"eins": 1,
"zwei": 2,
"drei": 3,
"vier": 4,
"fünf": 5}
s = pd. Serie (d)
S

Ausgabe:

eins 1
zwei 2
drei 3
vier 4
fünf 5
dtype: int64

So erstellen Sie eine Reihe mit einem Skalarwert

Wenn Sie eine Reihe mit einem Skalarwert erstellen möchten, müssen Sie die Index Streit.

s = pd. Reihe (1, Index = ["a", "b", "c", "d"])
S

Ausgabe:

ein 1
b 1
c 1
d 1
dtype: int64

3. So erstellen Sie einen Datenrahmen in Pandas

Ein DataFrame ist eine zweidimensionale Datenstruktur, in der Daten in Form von Zeilen und Spalten ausgerichtet sind. Ein DataFrame kann mit Wörterbüchern, Listen, einer Liste von Wörterbüchern, numpy Arrays usw. erstellt werden. In der realen Welt werden DataFrames unter Verwendung vorhandener Speicher wie CSV-Dateien, Excel-Dateien, SQL-Datenbanken usw. erstellt.

Das DataFrame-Objekt unterstützt eine Reihe von Attributen und Methoden. Wenn Sie mehr darüber erfahren möchten, können Sie die offizielle Dokumentation von Pandas-Datenrahmen.

So erstellen Sie einen leeren DataFrame

df = pd. Datenrahmen()
drucken (df)

Ausgabe:

Leerer DataFrame
Säulen: []
Index: []

So erstellen Sie einen DataFrame mit List

listObj = ["MUO", "Technologie", "vereinfacht"]
df = pd. DataFrame (listObj)
drucken (df)

Ausgabe:

 0
0 MUO
1 Technologie
2 vereinfacht

So erstellen Sie einen DataFrame mit Dictionary of ndarray/Lists

batmanData = {'Filmname': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Jahr der Veröffentlichung': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
drucken (df)

Ausgabe:

 Filmname Erscheinungsjahr
0 Batman beginnt 2005
1 Der dunkle Ritter 2008
2 The Dark Knight Rises 2012

So erstellen Sie einen DataFrame mithilfe einer Liste von Listen

Daten = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (Daten, Spalten = ['Name', 'Roll No.'])
drucken (df)

Ausgabe:

 Namensrolle Nr.
0 Alex 601
1 Bob 602
2 Cataline 603

So erstellen Sie einen DataFrame mit einer Liste von Wörterbüchern

data = [{'Name': 'Alex', 'Rollen-Nr.': 601},
{'Name': 'Bob', 'Rollen-Nr.': 602},
{'Name': 'Cataline', 'Rollen-Nr.': 603}]
df = pd. DataFrame (Daten)
drucken (df)

Ausgabe:

 Namensrolle Nr.
0 Alex 601
1 Bob 602
2 Cataline 603

Verwandt: So konvertieren Sie eine Liste in ein Wörterbuch in Python

So erstellen Sie einen DataFrame mit der zip()-Funktion

Verwenden Sie die Postleitzahl() Funktion zum Zusammenführen von Listen in Python.

Name = ['Alex', 'Bob', 'Cataline']
RollenNr = [601, 602, 603]
listOfTuples = Liste (zip (Name, RollNo))
df = pd. DataFrame (listOfTuples, column = ['Name', 'Roll No.'])
drucken (df)

Ausgabe:

 Namensrolle Nr.
0 Alex 601
1 Bob 602
2 Cataline 603

4. So lesen Sie CSV-Daten in Pandas

Eine CSV-Datei (Comma-Separated Values) ist eine Textdatei mit Trennzeichen, die ein Komma verwendet, um Werte zu trennen. Sie können eine CSV-Datei mit der read_csv() Methode bei Pandas. Wenn Sie den gesamten DataFrame drucken möchten, verwenden Sie die to_string() Methode.

In diesem und den nächsten Beispielen ist dies CSV-Datei wird verwendet, um die Operationen durchzuführen.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drucken (df.to_string())

Ausgabe:

5. So analysieren Sie DataFrames mit den Methoden head(), tail() und info()

So zeigen Sie Daten mit der Methode head() an

Die Kopf() -Methode ist eine der besten Möglichkeiten, um sich einen schnellen Überblick über den DataFrame zu verschaffen. Diese Methode gibt den Header und die angegebene Anzahl von Zeilen zurück, beginnend von oben.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
Drucken (df.Kopf (10))

Ausgabe:

Wenn Sie die Anzahl der Zeilen nicht angeben, werden die ersten 5 Zeilen zurückgegeben.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drucken (df.head())

Ausgabe:

So zeigen Sie Daten mit der tail()-Methode an

Die Schwanz() -Methode gibt den Header und die angegebene Anzahl von Zeilen zurück, beginnend von unten.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drucken (df.tail (10))

Ausgabe:

Wenn Sie die Anzahl der Zeilen nicht angeben, werden die letzten 5 Zeilen zurückgegeben.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drucken (df.tail())

Ausgabe:

So erhalten Sie Informationen zu den Daten

Die die Info() -Methoden geben eine kurze Zusammenfassung eines DataFrame zurück, einschließlich des Index-Dtypes und der Spalten-Dtypes, Nicht-Null-Werten und der Speichernutzung.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
drucken (df.info())

Ausgabe:

6. So lesen Sie JSON-Daten in Pandas

JSON (JavaSkrippe ÖObjekt notation) ist ein leichtgewichtiges Datenaustauschformat. Sie können eine JSON-Datei mit der read_json() Methode bei Pandas. Wenn Sie den gesamten DataFrame drucken möchten, verwenden Sie die to_string() Methode.

Im folgenden Beispiel ist dies JSON-Datei wird verwendet, um die Operationen durchzuführen.

Verwandt: Was ist JSON? Überblick für Laien

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
drucken (df.to_string())

Ausgabe:

Frischen Sie Ihr Python-Wissen mit eingebauten Funktionen und Methoden auf

Funktionen helfen, Ihren Code zu verkürzen und seine Effizienz zu verbessern. Funktionen und Methoden wie reduzieren(), Teilt(), aufzählen(), eval(), runden(), etc. kann Ihren Code robust und leicht verständlich machen. Es ist immer gut, über eingebaute Funktionen und Methoden Bescheid zu wissen, da diese Ihre Programmieraufgaben erheblich vereinfachen können.

TeilenTweetEmail
20 Python-Funktionen, die Sie kennen sollten

Die Python-Standardbibliothek enthält viele Funktionen, die Sie bei Ihren Programmieraufgaben unterstützen. Erfahren Sie mehr über die nützlichsten und erstellen Sie robusteren Code.

Weiter lesen

Verwandte Themen
  • Programmierung
  • Python
  • Web Entwicklung
  • Programmierung
  • Datenanalyse
Über den Autor
Yuvraj Chandra (69 veröffentlichte Artikel)

Yuvraj studiert Informatik an der University of Delhi, Indien. Seine Leidenschaft gilt der Full-Stack-Webentwicklung. Wenn er nicht gerade schreibt, erforscht er die Tiefe verschiedener Technologien.

Mehr von Yuvraj Chandra

Abonniere unseren Newsletter

Abonnieren Sie unseren Newsletter für technische Tipps, Rezensionen, kostenlose E-Books und exklusive Angebote!

Klicken Sie hier, um zu abonnieren