Pandas Series

Pandas Series是一个一维的、带标签的类数组对象,可以存储任何类型的数据。

Pandas Series可以看作是电子表格中的一列或DataFrame的单列。它包含两个主要组成部分:标签和数据。

例如,

0    'John'
1    30
2    6.2
3    False
dtype: object

在这里,该系列有两个列,标签(0123)和数据('John'306.2False)。

标签是分配给每个数据点的索引值,而数据代表Series中存储的实际值。

注意: Pandas Series可以存储不同数据类型的元素。它使用dtype(数据类型)的概念来管理和表示Series中的底层数据。

默认情况下,Pandas 在内部使用 object 数据类型来表示不同数据类型的 Series,object 是一种通用数据类型,可以容纳任何文本或数值数据类型(字符串、整数、布尔值等)。


创建 Pandas Series

有多种创建 Pandas Series 的方法,但最常见的方法是使用 Python 列表。让我们看一个使用列表创建 Series 的示例

import pandas as pd

# create a list
data = [10, 20, 30, 40, 50]

# create a series from the list my_series = pd.Series(data)
print(my_series)

输出

0    10
1    20
2    30
3    40
4    50
dtype: int64

在此示例中,我们创建了一个名为 data 的 Python 列表,其中包含五个整数值。然后,我们将此列表传递给 Series() 函数,该函数将其转换为名为 my_series 的 Pandas Series。

这里,dtype: int64 表示该 Series 存储 int64 类型的值。


标签

Pandas Series 中的标签默认是索引编号。与 DataFrame 和 Array 一样,Series 中的索引编号从 0 开始。

可以使用这些标签来访问指定的值。例如,

import pandas as pd

# create a list
data = [10, 20, 30, 40, 50]

# create a series from the list
my_series = pd.Series(data)

# display third value in the series print(my_series[2])

输出

30

在这里,我们使用标签访问了 my_series 的第三个元素。

我们还可以使用 Series() 方法中的 index 参数在创建 Series 时指定标签。例如,

import pandas as pd 

# create a list
a = [1, 3, 5]

# create a series and specify labels my_series = pd.Series(a, index = ["x", "y", "z"])
print(my_series)

输出

x    1
y    3
z    5
dtype: int64

在此示例中,我们将 index = ["x", "y", "z"] 作为参数传递给 Series() 以显式指定标签。

要访问 Series 元素,我们使用指定的标签而不是默认的索引编号。例如,

import pandas as pd 

# create a list
a = [1, 3, 5]

# create a series and specify labels
my_series = pd.Series(a, index = ["x", "y", "z"])

# display the value with label y print(my_series["y"])

输出

3

从 Python 字典创建 Series

您也可以从 Python 字典 创建 Pandas Series。例如,

import pandas as pd

# create a dictionary
grades = {"Semester1": 3.25, "Semester2": 3.28, "Semester3": 3.75}

# create a series from the dictionary my_series = pd.Series(grades)
# display the series print(my_series)

输出

Semester1    3.25
Semester2    3.28
Semester3    3.75
dtype: float64

在这里,我们创建了一个名为 grades 的字典类型的 float64 Series,名为 my_series

请注意,字典的已成为标签。

我们可以使用 index 参数通过选择字典中的特定项来进一步自定义 Series。例如,

import pandas as pd

# create a dictionary
grades = {"Semester1": 3.25, "Semester2": 3.28, "Semester3": 3.75}

# select specific dictionary items using index argument my_series = pd.Series(grades, index = ["Semester1", "Semester2"])
# display the series print(my_series)

输出

Semester1    3.25
Semester2    3.28
dtype: float64

我们的高级学习平台,凭借十多年的经验和数千条反馈创建。

以前所未有的方式学习和提高您的编程技能。

试用 Programiz PRO
  • 交互式课程
  • 证书
  • AI 帮助
  • 2000+ 挑战