از رنجی که می‌کشیم

✎ نویسنده: رامین مجاب

📅 تاریخ نگارش: ۲۲ آذر ۱۴۰۲

🕑 مدت‌زمان مطالعه: ۱ دقیقه


بعد از کلی تلاش کدی می‌نویسیم تا ساختار بی‌خودی که داده‌های پرداخت در بانک مرکزی بر اساسش گزارش شده است را تبدیل به یک فرمت مناسب‌تر کند، بعد تازه بوی گند داده‌ها بلند می‌شود. اینها مواردی است که با آنها بر خوردم:

  • سال ۹۴ در داده‌های شاپرک، در بعضی خانه‌ها عبارت ###### است و این یعنی اینها را از یک اکسل دیگر کپی کرده‌اند و بد هم کپی کرده‌اند. وای خدای من.
  • برای تهران در آذر ۹۴، برای ارزش تراکنش‌های موبایل عدد 1234 نوشته شده است. آخر چرااااااااااااااا؟! NA کردم تا درون‌یابی شود.
  • عدد منفی در داده‌های هرمزگان (بانک گردشگری، اردیبهشت ۹۸). در کد از abs استفاده کردم.
  • در بعضی از سال‌ها و بانک‌ها ارزش‌های ستون تعداد تراکنش پایانه شعب و مبلغ تراکنش‌ها جابه‌جا نوشته شده است. چکار کنم؟ گفتم عدد ماکزیمم را بگذار برای مبلغ، مینیمم تعداد.
  • و بسیاری ایراد دیگر که من نیافتم.
  • فرمت گزارش داده این نیست. کیفیت گزارش داده هم همچنین. افسوس


    «تمامی حقوق محفوظ است»