Tạo và Quản Lý Các Cột trong Excel Bằng Python

Mục Tiêu và Lợi Ích Của Bài Học

Trong bài học này, bạn sẽ học cách tạo và quản lý các cột trong Excel bằng Python. Sử dụng thư viện Pandasopenpyxl, bạn sẽ có khả năng tạo, chỉnh sửa và quản lý các cột dữ liệu trong bảng tính Excel. Đây là kỹ năng rất hữu ích khi làm việc với các bảng dữ liệu lớn hoặc khi bạn muốn tự động hóa các báo cáo Excel.

Lợi ích:

  • Tự động hóa quy trình quản lý dữ liệu trong Excel.
  • Tạo và chỉnh sửa cột trong Excel thông qua mã Python mà không cần phải thao tác thủ công.
  • Giảm thiểu sai sót khi làm việc với dữ liệu lớn.
  • Tiết kiệm thời gian khi làm việc với các bảng tính Excel và dữ liệu phức tạp.

1. Đọc Dữ Liệu Từ Excel

Giả sử bạn có một file dữ liệu Excel chứa thông tin về sản phẩm, với các cột: ProductName, SalesAmount, Cost, SaleDate, và Region. Đầu tiên, bạn sẽ đọc dữ liệu này vào Python bằng cách sử dụng thư viện Pandas.

File Excel có tên là SalesData.xlsx với dữ liệu như sau:

ProductNameSalesAmountCostSaleDateRegion
Laptop12008001/1/2023North
Phone8005001/2/2023South
Headphones150801/3/2023East
Tablet4503001/4/2023West

Cách đọc dữ liệu vào Python:

import pandas as pd

# Đọc dữ liệu từ Excel
df = pd.read_excel('SalesData.xlsx')

# Hiển thị dữ liệu
print(df)

Sau khi chạy đoạn mã này, bạn sẽ có DataFrame chứa toàn bộ dữ liệu từ bảng Excel. Bảng dữ liệu sẽ có các cột như ProductName, SalesAmount, Cost, SaleDate, và Region.


2. Tạo Các Cột Mới Trong Excel

Một trong những tính năng mạnh mẽ của Pandas là khả năng tạo các cột mới dựa trên các phép toán hoặc điều kiện.

Ví dụ: Tạo cột mới “Profit” (Lợi nhuận)

Giả sử bạn muốn tính Lợi nhuận cho mỗi sản phẩm bằng cách trừ Cost khỏi SalesAmount. Bạn có thể dễ dàng tạo một cột mới có tên Profit.

# Tạo cột "Profit" bằng cách trừ SalesAmount và Cost
df['Profit'] = df['SalesAmount'] - df['Cost']

# Hiển thị dữ liệu sau khi thêm cột mới
print(df)

Kết quả sẽ có thêm một cột Profit với giá trị tính toán từ SalesAmount trừ Cost.

ProductNameSalesAmountCostSaleDateRegionProfit
Laptop12008001/1/2023North400
Phone8005001/2/2023South300
Headphones150801/3/2023East70
Tablet4503001/4/2023West150

3. Chỉnh Sửa Các Cột Trong Excel

Sau khi tạo các cột mới, bạn có thể chỉnh sửa các cột hiện có. Ví dụ, bạn muốn thay đổi tên cột SalesAmount thành TotalSales để dễ dàng hiểu hơn.

Ví dụ: Đổi tên cột

# Đổi tên cột "SalesAmount" thành "TotalSales"
df.rename(columns={'SalesAmount': 'TotalSales'}, inplace=True)

# Hiển thị dữ liệu sau khi đổi tên cột
print(df)

Sau khi đổi tên, dữ liệu của bạn sẽ trông như sau:

ProductNameTotalSalesCostSaleDateRegionProfit
Laptop12008001/1/2023North400
Phone8005001/2/2023South300
Headphones150801/3/2023East70
Tablet4503001/4/2023West150

4. Xóa Cột Trong Excel

Nếu bạn muốn loại bỏ một cột không cần thiết, ví dụ như cột Region, bạn có thể dễ dàng xóa nó bằng Pandas.

Ví dụ: Xóa cột “Region”

# Xóa cột "Region"
df.drop(columns=['Region'], inplace=True)

# Hiển thị dữ liệu sau khi xóa cột
print(df)

Kết quả dữ liệu sẽ không còn cột Region nữa:

ProductNameTotalSalesCostSaleDateProfit
Laptop12008001/1/2023400
Phone8005001/2/2023300
Headphones150801/3/202370
Tablet4503001/4/2023150

5. Lưu Dữ Liệu Quay Lại Excel

Sau khi thực hiện các thao tác trên cột, bạn có thể lưu kết quả lại vào một file Excel mới. Dưới đây là cách lưu dữ liệu vào Excel.

# Lưu dữ liệu vào Excel sau khi thay đổi
df.to_excel('SalesData_output.xlsx', index=False)

Lệnh này sẽ lưu dữ liệu vào một file mới có tên SalesData_output.xlsx và không bao gồm chỉ số dòng (index) trong file Excel.


6. Kết Luận

Với Pandasopenpyxl, bạn có thể dễ dàng tạo, chỉnh sửa và quản lý các cột trong bảng tính Excel mà không cần thao tác thủ công. Việc sử dụng Python để tự động hóa các tác vụ này giúp bạn tiết kiệm thời gian và giảm thiểu sai sót khi làm việc với dữ liệu lớn. Bài học này sẽ cung cấp cho bạn một công cụ mạnh mẽ để làm việc hiệu quả với dữ liệu trong Excel.

Hy vọng bạn có thể áp dụng các kỹ năng này vào các dự án và công việc hàng ngày của mình!

Scroll to Top