```markdown

使用 `pandas` 读取 Excel 文件（`.xlsx`）

在 Python 中，pandas 是一个非常强大的数据分析工具，能够轻松地读取和处理各种数据格式。尤其是对于 Excel 文件，pandas 提供了简单易用的 read_excel 函数，帮助我们从 .xlsx 格式的文件中读取数据。

安装 `pandas` 和 `openpyxl`

首先，确保你已经安装了 pandas 和 openpyxl 库，因为 pandas 在读取 .xlsx 文件时依赖于 openpyxl 来处理 Excel 格式。如果还没有安装，可以使用以下命令安装：

bash pip install pandas openpyxl

使用 `pd.read_excel` 读取 `.xlsx` 文件

pandas 提供了 read_excel 函数来读取 Excel 文件。其基本语法如下：

```python import pandas as pd

读取 Excel 文件

df = pd.read_excel('your_file.xlsx') ```

这将读取 Excel 文件中的第一个工作表，并将数据加载到一个 DataFrame 中。

读取指定工作表

如果 Excel 文件中包含多个工作表，可以使用 sheet_name 参数指定要读取的工作表名称或索引。例如：

```python

通过工作表名称读取

df = pd.read_excel('your_file.xlsx', sheet_name='Sheet1')

通过工作表索引读取

df = pd.read_excel('your_file.xlsx', sheet_name=0) ```

sheet_name 可以是工作表的名称，也可以是工作表的索引（从 0 开始）。如果要读取多个工作表，可以传递一个列表：

```python

读取多个工作表

df = pd.read_excel('your_file.xlsx', sheet_name=['Sheet1', 'Sheet2']) ```

返回值是一个字典，其中键是工作表名称，值是相应的 DataFrame。

读取指定的列

有时你只需要读取 Excel 文件中的某些列。可以使用 usecols 参数来选择特定的列。你可以通过列名或列的索引来指定列。

```python

通过列名读取指定的列

df = pd.read_excel('your_file.xlsx', usecols=['Column1', 'Column2'])

通过列索引读取指定的列

df = pd.read_excel('your_file.xlsx', usecols=[0, 2]) ```

跳过指定行

如果文件中有一些前导行不需要加载，可以使用 skiprows 参数跳过这些行。例如，跳过前两行：

python df = pd.read_excel('your_file.xlsx', skiprows=2)

你还可以跳过特定的行：

python df = pd.read_excel('your_file.xlsx', skiprows=[0, 2, 4])

读取 Excel 文件时的其他参数

read_excel 函数还提供了许多其他可选参数，以便灵活地读取和处理 Excel 文件。例如：

header: 用于指定哪一行作为列名。
index_col: 用于指定哪一列作为索引列。
dtype: 用于指定列的数据类型。

```python

指定列名行和索引列

df = pd.read_excel('your_file.xlsx', header=0, index_col=0)

指定列的数据类型

df = pd.read_excel('your_file.xlsx', dtype={'Column1': str, 'Column2': float}) ```

示例：读取并处理 Excel 文件

假设我们有一个名为 sales_data.xlsx 的 Excel 文件，包含两个工作表：January 和 February，我们需要读取 January 工作表的前五列，并将其保存到一个 CSV 文件中。

```python import pandas as pd

读取指定工作表

df = pd.read_excel('sales_data.xlsx', sheet_name='January', usecols=[0, 1, 2, 3, 4])

保存为 CSV 文件

df.to_csv('january_sales.csv', index=False) ```

总结

使用 pandas 的 read_excel 函数，我们可以非常方便地从 .xlsx 文件中读取数据，并根据需求进行处理。无论是读取指定工作表、选择特定列，还是跳过无关的行，pandas 都提供了灵活的参数配置。掌握这些方法，可以帮助你高效地进行 Excel 文件的数据分析和处理。 ```

热搜
行业
快讯
专题

使用 pandas 读取 Excel 文件（.xlsx）

安装 pandas 和 openpyxl

使用 pd.read_excel 读取 .xlsx 文件

读取 Excel 文件

读取指定工作表

通过工作表名称读取

通过工作表索引读取

读取多个工作表

读取指定的列

通过列名读取指定的列

通过列索引读取指定的列

跳过指定行

读取 Excel 文件时的其他参数

指定列名行和索引列

指定列的数据类型

示例：读取并处理 Excel 文件

读取指定工作表

保存为 CSV 文件

总结

使用 `pandas` 读取 Excel 文件（`.xlsx`）

安装 `pandas` 和 `openpyxl`

使用 `pd.read_excel` 读取 `.xlsx` 文件