Pandas Series是一个一维的、带标签的类数组对象,可以存储任何类型的数据。
Pandas Series可以看作是电子表格中的一列或DataFrame的单列。它包含两个主要组成部分:标签和数据。
例如,
0 'John' 1 30 2 6.2 3 False dtype: object
在这里,该系列有两个列,标签(0、1、2 和 3)和数据('John'
、30
、6.2
、False
)。
标签是分配给每个数据点的索引值,而数据代表Series中存储的实际值。
注意: Pandas Series可以存储不同数据类型的元素。它使用dtype
(数据类型)的概念来管理和表示Series中的底层数据。
默认情况下,Pandas 在内部使用 object
数据类型来表示不同数据类型的 Series,object
是一种通用数据类型,可以容纳任何文本或数值数据类型(字符串、整数、布尔值等)。
创建 Pandas Series
有多种创建 Pandas Series 的方法,但最常见的方法是使用 Python 列表。让我们看一个使用列表创建 Series 的示例
import pandas as pd
# create a list
data = [10, 20, 30, 40, 50]
# create a series from the list
my_series = pd.Series(data)
print(my_series)
输出
0 10 1 20 2 30 3 40 4 50 dtype: int64
在此示例中,我们创建了一个名为 data 的 Python 列表,其中包含五个整数值。然后,我们将此列表传递给 Series()
函数,该函数将其转换为名为 my_series 的 Pandas Series。
这里,dtype: int64
表示该 Series 存储 int64
类型的值。
标签
Pandas Series 中的标签默认是索引编号。与 DataFrame 和 Array 一样,Series 中的索引编号从 0 开始。
可以使用这些标签来访问指定的值。例如,
import pandas as pd
# create a list
data = [10, 20, 30, 40, 50]
# create a series from the list
my_series = pd.Series(data)
# display third value in the series
print(my_series[2])
输出
30
在这里,我们使用标签访问了 my_series
的第三个元素。
我们还可以使用 Series()
方法中的 index
参数在创建 Series 时指定标签。例如,
import pandas as pd
# create a list
a = [1, 3, 5]
# create a series and specify labels
my_series = pd.Series(a, index = ["x", "y", "z"])
print(my_series)
输出
x 1 y 3 z 5 dtype: int64
在此示例中,我们将 index = ["x", "y", "z"]
作为参数传递给 Series()
以显式指定标签。
要访问 Series 元素,我们使用指定的标签而不是默认的索引编号。例如,
import pandas as pd
# create a list
a = [1, 3, 5]
# create a series and specify labels
my_series = pd.Series(a, index = ["x", "y", "z"])
# display the value with label y
print(my_series["y"])
输出
3
从 Python 字典创建 Series
您也可以从 Python 字典 创建 Pandas Series。例如,
import pandas as pd
# create a dictionary
grades = {"Semester1": 3.25, "Semester2": 3.28, "Semester3": 3.75}
# create a series from the dictionary
my_series = pd.Series(grades)
# display the series
print(my_series)
输出
Semester1 3.25 Semester2 3.28 Semester3 3.75 dtype: float64
在这里,我们创建了一个名为 grades 的字典类型的 float64
Series,名为 my_series。
请注意,字典的键已成为标签。
我们可以使用 index
参数通过选择字典中的特定项来进一步自定义 Series。例如,
import pandas as pd
# create a dictionary
grades = {"Semester1": 3.25, "Semester2": 3.28, "Semester3": 3.75}
# select specific dictionary items using index argument
my_series = pd.Series(grades, index = ["Semester1", "Semester2"])
# display the series
print(my_series)
输出
Semester1 3.25 Semester2 3.28 dtype: float64