4. Excel 文件

  1. read_excel读取Excel文件。需要用到第三方包xlrd/xlwt,前者读excel,后者写excel

    1. pandas.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0,
    2. index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None,
    3. na_values=None, thousands=None, convert_float=True, has_index_names=None,
    4. converters=None, true_values=None, false_values=None, engine=None,
    5. squeeze=False, **kwds)
    • io:一个字符串,或者file-like对象。如果是个字符串,则必须是个URL(其中包含了协议名,如http//,ftp//,file//等)
    • sheetname:一个字符串或者整数,或者列表。它指定选取Excel文件中哪个sheet。字符串指定的是sheet名,整数指定的是sheet的位置(0为第一个sheet
    • engine:一个字符串,指定了读写Excel的引擎。可以为:io.excel.xlsx.writerio.excel.xls.writerio.excel.xlsm.writer
    • 其他参数参考read_csv

    read_excel

  2. 保存DataFrameExcel文件:

    1. DataFrame.to_excel(excel_writer, sheet_name='Sheet1', na_rep='',
    2. float_format=None, columns=None, header=True, index=True, index_label=None,
    3. startrow=0, startcol=0, engine=None, merge_cells=True, encoding=None,
    4. inf_rep='inf', verbose=True)
    • excel_writer:一个字符串(文件名)或者一个ExcelWriter对象
    • sheet_name:一个字符串,指定sheet
    • na_rep:一个字符串,代表NaN
    • startrow/startcol:指定了左上角的单元格的位置
    • engine:一个字符串,指定了读写Excel的引擎。可以为:io.excel.xlsx.writerio.excel.xls.writerio.excel.xlsm.writer
    • merge_cells:一个布尔值。如果为True,则多级索引中,某些索引会合并单元格
    • inf_rep:一个字符串,只代表无穷大。

    to_excel