بعد از کلی تلاش کدی مینویسیم تا ساختار بیخودی که دادههای پرداخت در بانک مرکزی بر اساسش گزارش شده است را تبدیل به یک فرمت مناسبتر کند، بعد تازه بوی گند دادهها بلند میشود. اینها مواردی است که با آنها بر خوردم:
سال ۹۴ در دادههای شاپرک، در بعضی خانهها عبارت ###### است و این یعنی اینها را از یک اکسل دیگر کپی کردهاند و بد هم کپی کردهاند. وای خدای من.
برای تهران در آذر ۹۴، برای ارزش تراکنشهای موبایل عدد 1234 نوشته شده است. آخر چرااااااااااااااا؟! NA کردم تا درونیابی شود.
عدد منفی در دادههای هرمزگان (بانک گردشگری، اردیبهشت ۹۸). در کد از abs استفاده کردم.
در بعضی از سالها و بانکها ارزشهای ستون تعداد تراکنش پایانه شعب و مبلغ تراکنشها جابهجا نوشته شده است. چکار کنم؟ گفتم عدد ماکزیمم را بگذار برای مبلغ، مینیمم تعداد.
و بسیاری ایراد دیگر که من نیافتم.
فرمت گزارش داده این نیست. کیفیت گزارش داده هم همچنین. افسوس