pandas_南奥网

技术⋅ 01-26 ⋅ 1198 阅读

本文介绍多种在Pandas中将数值列格式化为“整数+千位逗号”（如1000"1,000"）的方法，涵盖显示控制、原地转换及导出时格式化，兼顾Pandas版本兼容性与实际使用场景。

技术⋅ 01-25 ⋅ 1181 阅读

本文介绍如何将三层嵌套字典（blocktextkey）高效转换为结构清晰的PandasDataFrame，通过转置、json_normalize、concat与MultiIndex.from_product组合实现自动化的多级列构建。

技术⋅ 01-25 ⋅ 1897 阅读

本文介绍如何将形如{block:{text:{key:value}}}的三层嵌套字典高效转换为具有MultiIndex列（如text1key1）的结构化DataFrame，适用于配置解析、实验结果汇总等场景。

技术⋅ 01-25 ⋅ 452 阅读

本文介绍如何将形如{block:{text:{key:value}}}的三层嵌套字典高效转换为具有多级列索引（MultiIndexcolumns）的PandasDataFrame，实现结构化表格展示，适用于配置解析、实验结果汇总等场景。

技术⋅ 01-25 ⋅ 275 阅读

本文介绍如何将形如{block:{text:{key:value}}}的三层嵌套字典，转化为具有多级列索引（BlockTextKey）的结构化PandasDataFrame，并支持直观打印与后续分析。

技术⋅ 01-25 ⋅ 932 阅读

explode()是pandas0.25+展开list列的原生方法，保持原始索引（重复出现），不支持多列同时展开，需链式调用；默认将None展开为NaN行，空值处理需谨慎；性能上易致内存飙升，索引重复后不再唯一。

技术⋅ 01-25 ⋅ 1276 阅读

reset_index()默认将MultiIndex所有层级转为列并重置为整数索引；可指定level参数展开部分层级；列名含元组时需用map(‘_’.join)或列表推导式扁平化；索引无名则生成level_0等默认列名，建议预先命名。

技术⋅ 01-25 ⋅ 1787 阅读

pd.merge()必须处理重复列名，无法跳过冲突；可行方案是提前删/重命名冲突列或显式选取列，suffixes参数必须为非空字符串元组，concat更适合同结构表拼接。

技术⋅ 01-25 ⋅ 1828 阅读

pd.Grouper专用于时间频率分组，需配合groupby使用，要求时间列为datetime64[ns]类型，支持freq如‘1T’‘1H’等，可混合其他列分组，时区、类型、对齐方式须准确设置。

技术⋅ 01-25 ⋅ 587 阅读

read_excel中sheet_name与skiprows组合使用最常用可靠：先定位目标sheet，再从其第0行起跳过指定行数；sheet_name支持字符串、整数或列表，单表推荐字符串；skiprows支持整数或可调用对象。

与“pandas”相关的TAG标签