首頁猿問如何在 Watson Studio...

如何在 Watson Studio 中使用 pandas read_csv 讀取壓縮的

Python

BIG陽 2021-10-12 15:07:55

要在我的本地 Jupyter 筆記本中讀取帶有 Pandas 的 zip 壓縮 csv 文件，我執(zhí)行：import pandas as pdpd.read_csv('csv_file.zip')但是，在 Watson Studio 中，read_csv()當我將文件名替換為云對象存儲流對象時會引發(fā)異常。這是我在 Watson Studio 中筆記本的第一個單元格：import typesfrom ibm_botocore.client import Configimport ibm_boto3def __iter__(self): return 0client = ibm_boto3.client(service_name='s3', ibm_api_key_id='...', ibm_auth_endpoint="...", config=Config(signature_version='oauth'), endpoint_url='...')body = client.get_object(Bucket='...', Key='csv_file.zip')['Body']if not hasattr(body, "__iter__"): body.__iter__ = types.MethodType( __iter__, body )現(xiàn)在，當我嘗試：import pandas as pddf = pd.read_csv(body)我得到：'utf-8' codec can't decode byte 0xbb in position 0: invalid start byte如果我指定compression='zip'：import pandas as pddf = pd.read_csv(body, compression='zip')消息是：'StreamingBody' object has no attribute 'seek'read_csv()在 Watson Studio 中是否有直接壓縮文件的方法，而無需顯式編寫解包代碼？（該pd.__version__是0.21.0在兩種環(huán)境中。）

查看完整描述