৩১ আগ, ২০২৫·7 মিনিট পড়তে

SLA টাইমার এবং এস্কেলেশন: রক্ষণযোগ্য ওয়ার্কফ্লো মডেলিং

Q: কেন কেবল একটি "breached = true/false" ফিল্ডই যথেষ্ট নয়?

একটি একক `breached = true/false` ফ্ল্যাগ প্রায়ই যথেষ্ট নয় কারণ তা কোনটা SLA ব্রিচ হয়েছে, তা, পজ আছে কিনা, বা ইতোমধ্যে এস্কেলেট করা হয়েছে কিনা—এই প্রাসঙ্গিক প্রসঙ্গ লুকিয়ে রাখে। স্পষ্ট স্টেট যেমন On track, Warning, Breached, Paused, Completed ব্যবহার করলে সিস্টেম বেশি পেডিক্টেবল ও অডিটেবল হয়।

Q: SLA আচরণ অডিট করা সহজ করতে আমি কোন ফিল্ডগুলো রাখব?

স্টেট ব্যাখ্যা করে এমন টাইমস্ট্যাম্পগুলো রাখুন: `started_at`, `due_at`, `breached_at`, এবং পজ ফিল্ডগুলো যেমন `paused_at`, `paused_reason`. এ ছাড়াও `last_escalation_level` রাখুন যাতে একই লেভেলে বারবার নোটিফাই না করা হয়।

Q: আমি কিভাবে এস্কেলেশন স্প্যাম ও ডুপ্লিকেট নোটিফিকেশন এড়াব?

নোটিফিকেশনগুলো state transitions-এর সঙ্গে বেঁধে দিন, যেমন `OK -> Warning` বা `Warning -> Breached`, কাঁচা ওয়াচ পিরিয়ড নয়। কুলডাউন উইন্ডো, রিট্রাই নিয়ম এবং স্টপ কন্ডিশন যোগ করুন যাতে বারবার স্প্যাম না হয়।

ক্লিয়ার স্টেট, রক্ষণযোগ্য নিয়ম ও সহজ এস্কেলেশন পথ সহ কিভাবে SLA টাইমার এবং এস্কেলেশন মডেল করা যায় তা শিখুন—যাতে ওয়ার্কফ্লো অ্যাপগুলো বদলানো সহজ থাকে।

কেন সময়ভিত্তিক রুলগুলো রক্ষণাবেক্ষণ করা কঠিন হয়ে যায়

সময়ভিত্তিক রুলগুলো সাধারণত সহজভাবে শুরু হয়: “টিকিটে ২ ঘন্টার মধ্যে কোন উত্তর না দিলে কাউকে নোটিফাই করো।” তারপর ওয়ার্কফ্লো বাড়ে, টিমগুলো এক্সসেপশন যোগ করে, এবং হঠাৎ করে কেউ নিশ্চিত নয় কী হবে। এভাবেই SLA টাইমার ও এস্কেলেশন একটি জটিল ল্যাবিরিন্থে পরিণত হয়।

চলমান অংশগুলোকে স্পষ্টভাবে নামকরণ করা সাহায্য করে।

একটি টাইমার হচ্ছে সেই ঘড়ি যা আপনি কোনো ইভেন্টের পরে চালু করেন (উদাহরণ: “টিকিট Waiting for Agent-এ গেলো”)। একটি এস্কেলেশন হচ্ছে যখন ঘড়ি একটি থ্রেশহোল্ডে পৌঁছায় তখন আপনি যে কাজটি করেন — লিডকে নোটিফাই করা, প্রায়োরিটি বদলানো, বা কাজ reasign করা। একটি ব্রিচ হলো সেই নথিভুক্ত বাস্তবতা যা বলে, “আমরা SLA মিস করেছি,” — এটি রিপোর্ট, এলার্ট এবং ফলো-আপে ব্যবহৃত হয়।

সমস্যা তখন দেখা দেয় যখন সময় সংক্রান্ত লজিক অ্যাপ জুড়ে ছড়িয়ে পড়ে: “আপডেট টিকিট” ফ্লোতে কয়েকটি চেক, নাইটলি জবে আরও চেক, এবং পরে কোনো বিশেষ কাস্টমারের জন্য এককালীন রুল যোগ করা। প্রতিটি অংশ নিজে করে অর্থবোধক, কিন্তু একসাথে তারা বিস্ময় তৈরি করে।

সাধারণ লক্ষণগুলো:

একই সময় হিসাব একাধিক ফ্লোতে কপি হয়, এবং ফিক্স সব কপি পর্যন্ত পৌঁছায় না।
এজ কেসগুলো অনুপযুক্তভাবে মিস হয় (পজ, রিসিউম, reassignment, স্ট্যাটাস টগল, উইকেন্ড বনাম ওয়ার্কিং আওয়ার)।
দুটি পথ একই ধরনের টাইমার শিডিউল করলে একটি রুল দুইবার ট্রিগার করে।
অডিটিং অনুমানভিত্তিক হয়ে যায়: “এইটা কেন এস্কেলেট হল?” বলার জন্য পুরো অ্যাপ পড়তে হয়।
ছোট পরিবর্তনগুলো ঝুঁকিপূর্ণ মনে হয়, তাই টিমগুলো মডেল ঠিক করার বদলে এক্সসেপশন যোগ করে।

লক্ষ্য হচ্ছে পূর্বানুমেয় আচরণ, যা পরে সহজে বদলানো যায়: SLA টাইমিংয়ের একটি স্পষ্ট সোর্স অফ ট্রুথ, রিপোর্টযোগ্য স্পষ্ট ব্রিচ স্টেট, এবং এমন এস্কেলেশন স্টেপ যা ভিজ্যুয়াল লজিক খুঁজে বেড়িয়ে না বদলাতে হয়।

শুরু করুন: আপনি যে SLA চান তা নির্ধারণ করে নিন

কোনো টাইমার তৈরির আগে, আপনি যে সঠিক প্রতিশ্রুতি পরিমাপ করবেন তা লিখে নিন। অনেকে প্রথম থেকেই সব সম্ভাব্য টাইম রুল কভার করার চেষ্টা করে, আর এখান থেকেই জটিলতা আসে।

সাধারণ SLA টাইপগুলো একইরকম শোনালেও পরিমাপ আলাদা:

First response: একজন মানুষের প্রথম অর্থপূর্ন উত্তরের সময় পর্যন্ত।
Resolution: ইস্যুটি প্রকৃতপক্ষে ক্লোজ হওয়ার সময় পর্যন্ত।
Waiting on customer: যখন আপনি ব্লক করা থাকেন তখন যা কাউন্ট করতে চান না।
Internal handoff: একটি নির্দিষ্ট কিউ-তে কতো সময় টিকিট বসে থাকতে পারে।
Reopen SLA: যখন একটি “closed” আইটেম আবার খোলে তখন কী হয়।

পরবর্তী ধাপে, নির্ধারণ করুন “সময়” বলতে কী বোঝাচ্ছে। ক্যালেন্ডার টাইম মানে ২৪/৭ গণনা। ওয়ার্কিং টাইম মানে শুধুমাত্র নির্ধারিত ব্যবসায়িক ঘন্টা (উদাহরণ: সোম-শুক্র, ৯-৬)। যদি আপনি সত্যিই ওয়ার্কিং টাইম না চান, শুরুতে এড়িয়ে চলুন — এটি ছুটি, টাইমজোন ও আংশিক দিনের মতো এজ কেস যোগ করে।

পরে পজগুলো সম্পর্কে স্পষ্ট হোন। একটি পজ কেবল “স্ট্যাটাস বদলেছে” নয়; এটি একটি কন্ট্রোল রুল যার একজন মালিক আছে। কে পজ করতে পারে (শুধু এজেন্ট, শুধু সিস্টেম, গ্রাহকের ক্রিয়া)? কোন স্ট্যাটাসগুলো পজ করে (Waiting on Customer, On Hold, Pending Approval)? কী পুনরায় চালু করে? পুনরায় চালু হলে কি অবশিষ্ট সময় থেকে চালানো হবে নাকি টাইমার রিস্টার্ট হবে?

অবশেষে, পণ্যের ভাষায় ব্রিচ কি বোঝায় তা নির্ধারণ করুন। একটি ব্রিচ হতে হবে একটি কংক্রিট বস্তু যা আপনি সংরক্ষণ ও কুয়ারি করতে পারেন, যেমন:

একটি ব্রিচ ফ্ল্যাগ (true/false)
একটি ব্রিচ টাইমস্ট্যাম্প (breached_at) (কখন ডেডলাইন মিস হলো)
একটি ব্রিচ স্টেট (Approaching, Breached, Resolved after breach)

উদাহরণ: “First response SLA breached” মানে হতে পারে টিকিটটিকে একটি Breached স্টেট দেওয়া, একটি breached_at টাইমস্ট্যাম্প সেট করা, এবং escalation level 1 সেট করা।

SLA-কে ছড়িয়ে থাকা কন্ডিশনের বদলে স্পষ্ট স্টেট হিসেবে মডেল করুন

যদি আপনি চান SLA টাইমার ও এস্কেলেশনগুলো পড়তে সহজ থাকুক, তাহলে SLA-কে একটি ছোট স্টেট মেশিন হিসেবে বিবেচনা করুন। যখন “সত্য” ছোট ছোট চেকগুলোর মধ্যে ছড়িয়ে থাকে (if now > due, if priority is high, if last reply is empty), ভিজ্যুয়াল লজিক দ্রুত অসংগঠিত হয়ে ওঠে এবং ছোট পরিবর্তনগুলি ভাঙতে শুরু করে।

শুরুতে একটি সংক্ষিপ্ত, সম্মত SLA স্টেট সেট নির্ধারণ করুন যা প্রতিটি ওয়ার্কফ্লো ধাপ বুঝবে। অনেক টিমের জন্য এগুলো বেশিরভাগ কেস কভার করে:

On track
Warning
Breached
Paused
Completed

একটি একক breached = true/false ফ্ল্যাগ খুব কমই যথেষ্ট। আপনাকে এখনও জানতে হবে কোনটা SLA ব্রিচ হয়েছে (first response বনাম resolution), তা কি বর্তমানে পজ আছে কিনা, এবং আপনি কি ইতোমধ্যে এস্কেলেট করেছেন। সেই প্রসঙ্গ ছাড়া মানুষ মন্তব্য, টাইমস্ট্যাম্প এবং স্ট্যাটাস নাম থেকে মানে পুনরায় ব্যুৎপন্ন করতে শুরু করে—এটিই লজিককে ভঙ্গুর করে।

স্টেট স্পষ্টভাবে রাখুন এবং ব্যাখ্যা করা টাইমস্ট্যাম্পগুলো সংরক্ষণ করুন। তারপর সিদ্ধান্তগুলো সহজ থাকে: আপনার evaluator রেকর্ড পড়ে, পরবর্তী স্টেট নির্ধারণ করে, এবং সবকিছু সেই স্টেট অনুযায়ী প্রতিক্রিয়া জানায়।

স্টেটের সাথে রাখা দরকারি ফিল্ডগুলো:

started_at এবং due_at (কোন ঘড়ি চালু করা হয়েছে এবং কখন ডিউ?)
breached_at (কখন এটি আসলে লাইন পার করেছে?)
paused_at এবং paused_reason (কেন ঘড়ি বন্ধ করা হয়েছে?)
breach_reason (কোন রুল ব্রিচ করেছে, সরল ভাষায়)
last_escalation_level (যাতে একই লেভেলে আবার নোটিফাই না করা হয়)

উদাহরণ: একটি টিকিট “Waiting on customer” এ গেলে SLA স্টেট Paused সেট করুন, paused_reason = "waiting_on_customer" রেকর্ড করুন, এবং টাইমার বন্ধ করে দিন। গ্রাহক যখন উত্তর দেয়, তখন পুনরায় চালু করুন started_at নতুনভাবে সেট করে (বা আনপজ করে due_at পুনঃগণনা করে)। একাধিক কন্ডিশনে খোঁজাখুনি দরকার পড়বে না।

এমন একটি এস্কেলেশন ল্যাডার ডিজাইন করুন যা আপনার অর্গানাইজেশনের উপযোগী

এস্কেলেশন ল্যাডার হচ্ছে একটি পরিষ্কার পরিকল্পনা যে SLA টাইমার কাছে পৌঁছলে বা ব্রিচ হলে কী হবে। ভুলটি হচ্ছে অর্গানোগ্রাম কপি করে ওয়ার্কফ্লোতে ঢুকিয়ে দেয়া। আপনি চান সবচেয়ে ছোট ধাপগুলো যা স্টল হওয়া আইটেমটি আবার চলতে সাহায্য করবে।

একটি সাধারণ ল্যাডার: অ্যাসাইন করা এজেন্ট (Level 0) প্রথম নাজ পায়, তারপর টিম লিড (Level 1) চলে আসে, এবং তার পর ম্যানেজার (Level 2)। এটি কাজ করে কারণ এটি সেই জায়গা থেকে শুরু করে যেখানে কাজ বাস্তবে করা যেতে পারে, এবং প্রয়োজন ছাড়া কর্তৃত্ব বাড়ায় না।

ওয়ার্কফ্লো এস্কেলেশন রুলগুলোকে মেইনটেনেবল রাখতে, এস্কেলেশন থ্রেশহোল্ডগুলো ডেটা হিসেবে স্টোর করুন, হার্ডকোড না করে। এগুলো একটি টেবিল বা সেটিংস অবজেক্টে রাখুন: “প্রথম রিমাইন্ডার ৩০ মিনিট পরে” বা “লিডকে ২ ঘন্টার পরে এস্কেলেট করুন।” যখন নীতি বদলাবে, আপনি একটি জায়গাই আপডেট করবেন, বহু ফ্লো এডিট করতে হবে না।

এস্কেলেশনগুলো সহায়ক রাখুন, নয়তো শব্দবহুল হবে

এস্কেলেশনগুলো বারবার ট্রিগার হলে তা স্প্যামে পরিণত করে। প্রতিটি ধাপে উদ্দেশ্য রাখার জন্য গার্ডরেল যোগ করুন:

একটি রিট্রাই রুল (উদাহরণ: যদি কোন অ্যাকশন না হলে Level 0-কে একবার রিসেন্ড করুন)।
একটি কুলডাউন উইন্ডো (উদাহরণ: একবার নোটিফিকেশন পাঠানোর ৬০ মিনিটের মধ্যে আর কোনো এস্কেলেশন পাঠাবেন না)।
একটি স্টপ কন্ডিশন (আইটেমটি কমপ্লায়েন্ট স্ট্যাটাসে চলে গেলে ভবিষ্যৎ এস্কেলেশন বাতিল করুন)।
একটি ম্যাক্স লেভেল (মানুষ ম্যানুয়ালি ট্রিগার না করলে Level 2’র বেশি যাবেন না)।

এস্কেলেশনের পরে কে আইটেমের মালিক হবে তা নির্ধারণ করুন

শুধু নোটিফিকেশন দিলে স্টল হওয়া কাজ ঠিক হয় না যদি দায়িত্ব অস্পষ্ট থাকে। মালিকানা রুল আগে থেকেই নির্ধারণ করুন: টিকিট কি এজেন্টের কাছে থাকবে, লিডকে reassigned হবে, না কি একটি শেয়ার্ড কিউতে যাবে?

উদাহরণ: Level 1 এস্কেলেশনের পরে টিকিট লিডকে reassigned করুন এবং মূল এজেন্টকে watcher হিসেবে রাখুন। এতে পরবর্তী কে কাজ করবে তা স্পষ্ট হয় এবং একই আইটেম মানুষগুলোর মধ্যে টপকানো বন্ধ হয়।

রক্ষণযোগ্য প্যাটার্ন: ইভেন্টস, evaluator, অ্যাকশন

সোর্স কোডসহ একটি এস্কেপ হ্যাচ রাখুন

হোস্টিং ও রিলিজ নিয়ন্ত্রণের দরকার হলে আসল সোর্স কোড এক্সপোর্ট করুন।

শুরু করুন

SLA টাইমার ও এস্কেলেশনগুলো রক্ষণযোগ্য রাখার সহজ উপায় হচ্ছে এগুলোকে একটি ছোট সিস্টেম হিসেবে দেখা: ইভেন্টস, একটি evaluator, এবং অ্যাকশন। এতে টাইম লজিক কয়েক ডজন "if time > X" চেকে ছড়ায় না।

1) ইভেন্টস: শুধু যা ঘটেছে তা রেকর্ড করুন

ইভেন্টগুলো সহজ বাস্তবতা যেগুলো টাইমার ম্যাথে থাকা উচিত না। এগুলো উত্তর দেয় "কি বদলেছে?"—না যে "এটার জন্য কি করা উচিত?"। টিপিক্যাল ইভেন্টস: ticket created, agent replied, customer replied, status changed, বা ম্যানুয়াল pause/resume।

এগুলো টাইমস্ট্যাম্প ও স্ট্যাটাস ফিল্ড হিসেবে সংরক্ষণ করুন (যেমন: created_at, last_agent_reply_at, last_customer_reply_at, status, paused_at)।

2) Evaluator: একটি জায়গা যা সময় গণনা করে ও স্টেট সেট করে

একটি একক "SLA evaluator" স্টেপ রাখুন যা কোনো ইভেন্টের পরে ও একটি পিরিয়ডিক শিডিউলে চলে। এই evaluator-ই একমাত্র জায়গা যা due_at ও অবশিষ্ট সময় গণনা করে। এটি বর্তমান ফ্যাক্টগুলো পড়ে, ডেডলাইনগুলো পুনঃগণনা করে, এবং স্পষ্ট SLA স্টেট ফিল্ডগুলো লেখা উচিত যেমন sla_response_state এবং sla_resolution_state।

এখানেই ব্রিচ স্টেট মডেলিং পরিষ্কার থাকে: evaluator OK, AtRisk, Breached-এর মতো স্টেট সেট করে, কন্ডিশন-ভিত্তিক নোটিফিকেশন লুকায় না।

3) অ্যাকশন: স্টেট পরিবর্তনের উপর প্রতিক্রিয়া জানাও, টাইম ম্যাথে নয়

নোটিফিকেশন, অ্যাসাইনমেন্ট, ও এস্কেলেশনগুলো শুধুমাত্র স্টেট পরিবর্তনের সময় ট্রিগার করা উচিত (উদাহরণ: OK -> AtRisk)। স্টেট আপডেট থেকে মেসেজিং আলাদা রাখুন। তাহলে আপনি যে কাউকে নোটিফাই করবেন তা পরিবর্তন করতে পারবেন হিসাব করার জায়গাটা ছুঁড়ে না।

ধাপে ধাপে: ভিজ্যুয়াল লজিকে টাইমার ও এস্কেলেশন তৈরি করা

একটি রক্ষণযোগ্য সেটআপ সাধারণত এরকম দেখা যায়: রেকর্ডে কয়েকটি ফিল্ড, একটি ছোট পলিসি টেবিল, এবং একটি evaluator যা সিদ্ধান্ত নেয় কী হবে পরেরটা।

1) ডেটা সেটআপ করুন যাতে সময় লজিকের এক ঘর থাকে

SLA-কে ধারণ করে এমন এনটিটি (টিকিট, অর্ডার, রিকুয়েস্ট) নিয়ে শুরু করুন। স্পষ্ট টাইমস্ট্যাম্প এবং একটি একক "current SLA state" ফিল্ড যোগ করুন। এটি সাধারণ এবং পূর্বানুমেয় রাখুন।

তারপর একটি ছোট পলিসি টেবিল যোগ করুন যা রুলগুলো বর্ণনা করে, বহু ফ্লো-এ হার্ডকোড করার বদলে। একটি সাধারণ ভার্সনে প্রতিটি প্রায়োরিটির জন্য একটি রো (P1, P2, P3) এবং টার্গেট মিনিট ও এস্কেলেশন থ্রেশহোল্ড থাকবে (উদাহরণ: warn at 80%, breach at 100%)। এটা এক রেকর্ড বদলানো বনাম পাঁচটি ওয়ার্কফ্লো এডিট করার মধ্যে পার্থক্য তৈরি করে।

2) অনেকগুলো টাইমারের বদলে একটি শিডিউলড evaluator চালান

প্রতিটি জায়গায় আলাদা টাইমার তৈরি করার বদলে, একটি শিডিউলড প্রসেস ব্যবহার করুন যা নিয়মিত আইটেমগুলো চেক করে (কঠোর SLA-র জন্য প্রতিমিনিটে, অনেক টিমের জন্য প্রতি ৫ মিনিটে)। শিডিউল evaluator:

সক্রিয় রেকর্ড সিলেক্ট করে (closed নয়)
“now vs due” ক্যালকুলেট করে এবং পরবর্তী স্টেট নির্ধারণ করে
পরের চেকের সময়ও বের করে (যাতে বারবার চেক করা লাগে না)
sla_state ও next_check_at লিখে

এতে আপনি একটি evaluator ডিবাগ করবেন, বহু টাইমার নয়।

3) অ্যাকশনগুলো এজ-ট্রিগার্ড রাখুন (শুধু স্টেট পরিবর্তনের উপর)

Evaluator নতুন স্টেট ও বিকাশ ঘটেছে কিনা উভয় আউটপুট করা উচিত। কেবল স্টেট বদলালে মেসেজ বা টাস্ক তৈরি করুন (উদাহরণ ok -> warning, warning -> breached)। যদি রেকর্ড ঘণ্টাখানেক ধরে breached থাকে, আপনি প্রতি মিনিটে ১২ বার নোটিফাই চাইবেন না।

একটি বাস্তবিক প্যাটার্ন: sla_state ও last_escalation_level সংরক্ষণ করুন, নতুন গণনার সাথে তুলনা করুন, এবং কেবল তখনই মেসেজিং (ইমেল/SMS/Telegram) বা অভ্যন্তরীণ টাস্ক তৈরি করুন।

পজ, রিসিউম এবং স্ট্যাটাস পরিবর্তন হ্যান্ডেল করা

এস্কেলেশন নিয়মকে সেটিংসে রাখুন

এস্কেলেশন থ্রেশহোল্ডগুলো বিচ্ছিন্ন কন্ডিশনের বদলে একটি সহজ পলিসি টেবিলে রাখুন।

অ্যাপ তৈরি করুন

পজগুলোই সেই জায়গা যেখানে সাধারণত টাইম রুলগুলো জটিল হয়ে ওঠে। যদি আপনি এগুলো স্পষ্টভাবে মডেল না করেন, আপনার SLA বা তো চলতেই থাকবে যখন চলা উচিত নয়, বা কেউ ভুল স্ট্যাটাস ক্লিকে করে রিসেট করে দেবে।

একটি সরল নিয়ম: কেবল একটি স্ট্যাটাস (বা ছোট সেট) ঘড়ি পজ করে। সাধারণ পছন্দ: Waiting for customer। যখন টিকিট ঐ স্ট্যাটাসে প্রবেশ করে, pause_started_at টাইমস্ট্যাম্প সেভ করুন। গ্রাহক উত্তর দিলে এবং টিকিট ঐ স্ট্যাটাস থেকে বেরোলে, pause_ended_at লিখুন এবং সেই পজ ডিউরেশন paused_total_seconds-এ যোগ করুন।

শুধুই একটি কাউন্টার রাখবেন না — প্রতিটি পজিং উইন্ডো (start, end, triggered_by) ক্যাপচার করুন যাতে আপনার কাছে অডিট ট্রেইল থাকে। পরে কেউ জিজ্ঞেস করলে কেন কেস ব্রিচ করেছে, আপনি দেখাতে পারবেন এটি ১৯ ঘন্টা গ্রাহকের উপর অপেক্ষা করেছিল।

রিসাইনমেন্ট এবং সাধারণ স্ট্যাটাস পরিবর্তন ঘড়ি রিসেট করা উচিত নয়। SLA টাইমস্ট্যাম্পগুলোকে মালিকানা ফিল্ড থেকে আলাদা রাখুন। উদাহরণস্বরূপ sla_started_at এবং sla_due_at একবার সেট করা উচিত (সৃষ্টি হলে, অথবা যখন SLA পলিসি বদলে), আর reassignment কেবল assignee_id আপডেট করে। এরপর evaluator elapsed time ক্যালকুল করবে: now - sla_started_at - paused_total_seconds।

নিয়মগুলো যা SLA টাইমার ও এস্কেলেশনকে পূর্বানুমেয় রাখে:

কেবল স্পষ্ট স্ট্যাটাসগুলিতেই পজ দিন (যেমন Waiting for customer), সফট ফ্ল্যাগে নয়।
শুধুই ঐ স্ট্যাটাস ত্যাগ করার সময় রিসিউম করুন, কোনো ইনবাউন্ড মেসেজ-এ নয়।
reassignment-এ SLA কখনো রিসেট করবেন না; এটিকে রাউটিং হিসেবে বিবেচনা করুন, নতুন কেস হিসেবে নয়।
ম্যানুয়াল ওভাররাইড অনুমোদন করুন, কিন্তু একটি কারণ লাগবে এবং কাদের জন্য সীমাবদ্ধ তা নির্ধারণ করুন।
প্রতিটি স্ট্যাটাস পরিবর্তন ও পজ উইন্ডো লগ করুন।

উদাহরণ দৃশ্য: রেসপন্স ও রেজোলিউশন SLA সহ সাপোর্ট টিকিট

একটি শিডিউল্ড evaluator ব্যবহার করুন

অনেকগুলো টিমারের বদলে একটি ভিজ্যুয়াল প্রোসেস থেকে শিডিউল্ড চেকগুলো চালান।

এখন তৈরি করুন

একটি সহজ পরীক্ষা হল একটি সাপোর্ট টিকিট যেখানে দুটি SLA আছে: প্রথম রেসপন্স ৩০ মিনিটে, এবং সম্পূর্ণ রেজোলিউশন ৮ ঘন্টার মধ্যে। যদি লজিক স্ক্রিন এবং বোতামের জুড়ে ছড়িয়ে থাকে, এখানে ভাঙন হয়।

ধরা যাক প্রতিটি টিকিট এইগুলো রাখে: state (New, InProgress, WaitingOnCustomer, Resolved), response_status (Pending, Warning, Breached, Met), resolution_status (Pending, Warning, Breached, Met), এবং টাইমস্ট্যাম্পগুলো যেমন created_at, first_agent_reply_at, এবং resolved_at।

একটি বাস্তবসম্মত টাইমলাইন:

09:00 টিকিট ক্রিয়েট (New)। Response ও resolution টাইমার শুরু।
09:10 Agent A-কে অ্যাসাইন করা (এখনও Pending)।
09:25 এখনও কোন এজেন্ট রিপ্লাই নেই। Response 25 মিনিটে Warning এ যায়।
09:40 এখনও উত্তর নেই। Response 30 মিনিটে Breached এ যায়।
09:45 এজেন্ট রিপ্লাই করে। Response Met হয়ে যায় (যদি এটা Breached ছিল, তখনও ব্রিচ রেকর্ড রাখুন এবং Met হিসেবে চিহ্নিত করুন রিপোর্টিংয়ের জন্য)।
10:30 গ্রাহক আরও তথ্য দেয়। টিকিট InProgress এ যায়, resolution চলতে থাকে।
11:00 এজেন্ট একটি প্রশ্ন করে। টিকিট WaitingOnCustomer এ যায় এবং resolution টাইমার পজ হয়।
14:00 গ্রাহক উত্তর দেয়। টিকিট InProgress এ ফিরে আসে এবং resolution টাইমার রিজিউম করে।
16:30 টিকিট রেজল্ভ করা হয়। মোট সক্রিয় সময় 8 ঘন্টার কম হলে Resolution Met হবে, নাহলে Breached হবে।

এস্কেলেশনের জন্য একটি পরিষ্কার চেইন রাখুন যা স্টেট ট্রানজিশনে ট্রিগার করে। উদাহরণ: response Warning হলে অ্যাসাইনড এজেন্টকে নোটিফাই করুন। যখন Breached হয়, টিম লিডকে নোটিফাই করুন এবং প্রায়োরিটি আপডেট করুন।

প্রতিটি ধাপে একই ছোট ফিল্ড সেট আপডেট করুন যাতে বিশ্লেষণ সহজ থাকে:

response_status বা resolution_status Pending, Warning, Breached, বা Met-এ সেট করুন।
*_warning_at ও *_breach_at টাইমস্ট্যাম্প একবার লিখুন, পরে ওভাররাইট করবেন না।
escalation_level (0, 1, 2) বৃদ্ধি করুন এবং escalated_to (Agent, Lead, Manager) সেট করুন।
sla_events লগ রো যোগ করুন ইভেন্ট টাইপ এবং কে নোটিফাই হয়েছে সহ।
প্রয়োজনে priority ও due_at সেট করুন যাতে UI ও রিপোর্টে এস্কেলেশন প্রতিফলিত হয়।

মূল কথা: Warning ও Breached স্পষ্ট স্টেট। ডেটাতে দেখা যায়, অডিট করা যায়, এবং ল্যাডার পরে খুঁজে বের না করেই বদলানো যায়।

সাধারণ ফাঁদ এবং কিভাবে এড়াবেন

SLA লজিক তখন জটিল হয় যখন তা ছড়িয়ে পড়ে। এখানে একটি দ্রুত টাইম চেক চেপে দিন, ওদিকে একটি শর্তগত এলার্ট সেখানে, এবং শীঘ্রই কেউ ব্যাখ্যা করতে পারে না কেন টিকিট এস্কেলেট হলো। SLA টাইমার ও এস্কেলেশনকে একটি ছোট, কেন্দ্রীভূত লজিকে রাখুন যাতে প্রতিটি স্ক্রিন ও অ্যাকশন সেটির ওপর নির্ভর করে।

একটি সাধারণ ফাঁদ হলো অনেক জায়গায় সময় চেক এমবেড করা (UI স্ক্রিন, API হ্যান্ডলার, ম্যানুয়াল অ্যাকশন)। সমাধান: একটি evaluator-এ SLA স্ট্যাটাস গণনা করুন এবং রেকর্ডে ফল লিখুন। স্ক্রিনগুলো স্ট্যাটাস পড়ুক, নতুন করে মানে তৈরি না করুক।

আরেকটি ফাঁদ হলো টাইমারগুলোর মধ্যে ভিন্ন ঘড়ি ব্যবহার করা। যদি ব্রাউজার "minutes since created" হিসাব করে আর ব্যাকএন্ড সার্ভার টাইম ব্যবহার করে, তাহলে স্লিপ, টাইমজোন ও ডেলাইট সেভিং-এডজ কেস দেখা যাবে। যে কোনো এস্কেলেশন ট্রিগারের জন্য সার্ভার টাইম ব্যবহার করুন।

নোটিফিকেশনও দ্রুত শব্দবহুল হয়ে উঠতে পারে। যদি আপনি "প্রতি মিনিটে চেক করে overdue হলে পাঠাও" করেন, মানুষ প্রতি মিনিটে স্প্যাম পাবে। মেসেজগুলোকে ট্রানজিশনের সাথে বেঁধে দিন: "warning sent", "escalated", "breached"—তারপর প্রতিটি ধাপেই একবার করে পাঠান এবং কি ঘটেছে তা অডিট করুন।

বিজনেস আওয়ারস লজিকও জটিলতার উৎস। যদি প্রতি রুলেই আলাদা "if weekend then…" শাখা থাকে, আপডেট করা কষ্টকর হবে। বিজনেস আওয়ারস ম্যাথ একটি ফাংশনে (বা শেয়ার করা ব্লকে) রাখুন যা রিটার্ন করে “এখন পর্যন্ত SLA মিনিট কত খরচ হয়েছে”, এবং এটিই পুনঃব্যবহার করুন।

সবশেষে, ব্রিচটি স্ক্র্যাচ থেকে পুনরায় গণনা করার উপর নির্ভর করবেন না। ব্রিচ ঘটে যাওয়ার মুহূর্ত সংরক্ষণ করুন:

প্রথমবার ব্রিচ ডিটেক্ট করলে breached_at সেভ করুন, এবং এটি কখনই ওভাররাইট করবেন না।
escalation_level ও last_escalated_at সেভ করুন যাতে অ্যাকশনগুলো idempotent থাকে।
notified_warning_at (বা অনুরূপ) সেভ করুন যাতে রিপিটেড এলার্ট রোধ হয়।

উদাহরণ: একটি টিকিট 10:07-এ "Response SLA breached" এ যায়। যদি আপনি শুধু পুনরায় গণনা করেন, পরে স্ট্যাটাস চেঞ্জ বা পজ/রিসিউম বাগ ব্রিচকে 10:42-এ দেখাতে পারে। breached_at = 10:07 থাকলে রিপোর্ট ও পোষ্টমর্টেম কনসিস্টেন্ট থাকে।

রক্ষণযোগ্য SLA লজিকের দ্রুত চেকলিস্ট

ডেটায় ব্রিচগুলো স্পষ্ট করুন

টিকিট, SLA এবং ব্রিচ টাইমস্ট্যাম্প এক ডেটা স্কিমায় মডেল করুন যাতে অ্যাডিট করা যায়।

নির্মাণ শুরু করুন

টাইমার এবং এলার্ট যোগ করার আগে একবার দেখে নিন যে নিয়মগুলো এক মাস পরেও পড়তে সুবিধা হবে:

প্রতিটি SLA-এর স্পষ্ট সীমা আছে। ক্লক কখন শুরু হবে, কখন থেমে যাবে, পজ নিয়ম কী — সব লিখে রাখুন। যদি আপনি ক্লক শুরু করার একটি ইভেন্টকে নির্দেশ করতে না পারেন, আপনার লজিক র‍্যান্ডম কন্ডিশনে ছড়িয়ে পড়বে।
এস্কেলেশনগুলো ল্যাডার, এলার্টের গাদা নয়। প্রতিটি লেভেলের জন্য থ্রেশহোল্ড (30m, 2h, 1d), কে পাবে, কুলডাউন, এবং ম্যাক্স লেভেল নির্ধারণ করুন।
স্টেট পরিবর্তনের সাথে প্রসঙ্গসহ লগ আছে। যখন SLA স্টেট পরিবর্তন হয় (Running, Paused, Breached, Resolved), কে ট্রিগার করলো, কখন হলো, এবং কেন—সেটি সংরক্ষণ করুন।
শিডিউলড চেকগুলো দুইবারও চালানো নিরাপদ। আপনার evaluator idempotent হওয়া উচিত: একই রেকর্ডের জন্য পুনরায় চললেও ডুপ্লিকেট এস্কেলেশন বা একই মেসেজ আবার পাঠাবে না।
নোটিফিকেশনগুলো ট্রানজিশন থেকে আসে, কাঁচা টাইম ম্যাথ থেকে নয়। স্টেট বদলালে মেসেজ পাঠান, কাঁচা শর্ত থেকে নয়।

একটি বাস্তবিক পরীক্ষা: এমন একটি টিকিট নিন যা ব্রিচ হওয়ার কাছাকাছি আছে এবং তার সময়রেখা রেপ্লে করুন। যদি আপনি প্রতিটি স্ট্যাটাস চেঞ্জে কী ঘটবে তা পুরো ওয়ার্কফ্লো না পড়ে বলতে না পারেন, আপনার মডেল খুব ছড়িয়ে আছে।

পরবর্তী ধাপ: বাস্তবায়ন করুন, পর্যবেক্ষণ করুন, তারপর শোধরান

ছোটest কার্যকর অংশ আগে তৈরি করুন। একটা SLA (উদাহরণ: first response) এবং একটি এস্কেলেশন লেভেল (উদাহরণ: টিম লিডকে নোটিফাই) নিয়ে শুরু করুন। একটি সপ্তাহের বাস্তব ব্যবহার থেকে আপনি কাগজে থাকা নিখুঁত ডিজাইনের চেয়ে বেশি শিখবেন।

থ্রেশহোল্ড ও রিসিপিয়েন্টগুলো ডেটায় রাখুন, লজিকে নয়। মিনিট, ঘন্টা, বিজনেস-আওয়ারস রুল, কে নোটিফাই হবে, এবং কোন কিউ আইটেমটি রাখে—এসবকে টেবল বা কনফিগ রেকর্ডে রাখুন। তাহলে ব্যবসা সংখ্যাগুলো ও রাউটিং টুইক করলে ওয়ার্কফ্লো স্থিতিশীল থাকে।

শুরুতেই একটি সিম্পল ড্যাশবোর্ড দেখার পরিকল্পনা রাখুন। বড় অ্যানালিটিক্স সিস্টেম লাগে না—শুধু একটি শেয়ার করা ছবিই যথেষ্ট: on track, warning, breached, escalated।

যদি আপনি নো-কোড ওয়ার্কফ্লো অ্যাপে এটা বানান, এমন প্ল্যাটফর্ম বেছে নিন যা ডেটা মডেলিং, ভিজ্যুয়াল বিজনেস প্রসেস এবং শিডিউলড evaluator এক জায়গায় দেয়। উদাহরণস্বরূপ, AppMaster (appmaster.io) ডেটাবেস মডেলিং, ভিজ্যুয়াল বিজনেস প্রসেস এবং প্রোডাকশন-রেডি অ্যাপ জেনারেট করতে পারে—এটি "events, evaluator, actions" প্যাটার্নের সঙ্গে ভালভাবে মানায়।

নিরাপদভাবে শোধরান এই অর্ডারে:

Level 1 ভালো কাজ করলে এক লেভেল বাড়ান
এক SLA থেকে দুইটিতে বাড়ান (response এবং resolution)
পজ/রিসিউম রুল যোগ করুন (waiting on customer, on hold)
নোটিফিকেশন শক্ত করুন (ডিডুপ, quiet hours, সঠিক রিসিপিয়েন্ট)
সাপ্তাহিক রিভিউ: ডেটায় থ্রেশহোল্ড অ্যাডজাস্ট করুন, ফ্লো রিওয়্যার করার বদলে

আপনি প্রস্তুত হলে প্রথমে ছোট সংস্করণ তৈরি করুন, পরে বাস্তব ফিডব্যাক ও টিকিট নিয়ে তা বাড়ান।

প্রশ্নোত্তর

প্রতিশ্রুতি (first response বা resolution) স্পষ্টভাবে সংজ্ঞায়িত করে শুরু করুন — ঠিক কোন ইভেন্টে ঘড়ি চালু হয়, কী পজ করে এবং কীভাবে ব্রিচ কাউন্ট করবেন। তারপর টাইম মেথ ম্যাথ একটিই evaluator-এ কেন্দ্রীভূত করুন, স্ক্যাটার করা “now > X” চেকগুলো বন্ধ করুন।

টাইমার হচ্ছে কোনো ইভেন্টের পরে আপনি চালানো ঘড়ি (যেমন টিকিট স্ট্যাটাস বদলানো)। এস্কেলেশন হল ওই থ্রেশহোল্ডে পৌঁছালে আপনি যে কাজটা করেন (লিডকে নোটিফাই করা, প্রায়োরিটি বদলানো ইত্যাদি)। ব্রিচ হল সেই সংরক্ষিত বাস্তবতা যে SLAটি মিস হয়েছে — যা রিপোর্ট এবং ফলো-আপে ব্যবহার করা যায়।

হ্যাঁ। First response হলো প্রথম অর্থপূর্ন মানুষের উত্তর দেওয়ার সময়, আর resolution হলো সমস্যাটি সম্পূর্ণরূপে বন্ধ হওয়ার সময়। পজিং এবং পুনরায় খোলার ক্ষেত্রে এরা আলাদা আচরণ করে, তাই আলাদা মডেল রাখতে সারল্য বাড়ে এবং রিপোর্টিং সঠিক থাকে।

শুরুতে ক্যালেন্ডার টাইম ব্যবহার করুন কারণ এটা সহজ এবং ডিবাগ করা সহজ। কেবল তখনই ওয়ার্কিং-টাইম (ব্যবসায়িক ঘন্টা) যোগ করুন যখন তা সত্যিই প্রয়োজন — কারণ ছুটির দিন, টাইমজোন এবং আংশিক দিনের লজিক জটিলতা বাড়ায়।

পজগুলো স্পষ্ট স্টেট হিসেবে মডেল করুন, যেমন Waiting on Customer; পজ শুরু ও শেষের টাইমস্ট্যাম্প রাখুন। রিসিউম হলে বাকি সময় চালিয়ে যান অথবা এক জায়গায় ডিউ টাইম পুনরায় ক্যালকুলেট করুন — কিন্ত এলোমেলো স্ট্যাটাস টগলে ঘড়ি রিসেট করবেন না।

একটি একক breached = true/false ফ্ল্যাগ প্রায়ই যথেষ্ট নয় কারণ তা কোনটা SLA ব্রিচ হয়েছে, তা, পজ আছে কিনা, বা ইতোমধ্যে এস্কেলেট করা হয়েছে কিনা—এই প্রাসঙ্গিক প্রসঙ্গ লুকিয়ে রাখে। স্পষ্ট স্টেট যেমন On track, Warning, Breached, Paused, Completed ব্যবহার করলে সিস্টেম বেশি পেডিক্টেবল ও অডিটেবল হয়।

স্টেট ব্যাখ্যা করে এমন টাইমস্ট্যাম্পগুলো রাখুন: started_at, due_at, breached_at, এবং পজ ফিল্ডগুলো যেমন paused_at, paused_reason. এ ছাড়াও last_escalation_level রাখুন যাতে একই লেভেলে বারবার নোটিফাই না করা হয়।

ছোট একটি ল্যাডার তৈরি করুন — কাজটি যে ব্যক্তি করতে পারে তিনিই প্রথম নোটিফাই হোন, তারপর লিড, তারপর ম্যানেজার। থ্রেশহোল্ড ও রিসিপিয়েন্টগুলো ডেটায় (একটি পলিসি টেবিলে) রাখুন যাতে টাইমিং বদলাতে একাধিক ফ্লো এডিট করতে না হয়।

নোটিফিকেশনগুলো state transitions-এর সঙ্গে বেঁধে দিন, যেমন OK -> Warning বা Warning -> Breached, কাঁচা ওয়াচ পিরিয়ড নয়। কুলডাউন উইন্ডো, রিট্রাই নিয়ম এবং স্টপ কন্ডিশন যোগ করুন যাতে বারবার স্প্যাম না হয়।

প্যাটার্নটি: ইভেন্টস (ঘটনা) রেকর্ড করুন, একটি একক evaluator ডেডলাইনগুলো ক্যালকুলেট করে SLA স্টেট সেট করবে, এবং অ্যাকশনে শুধুমাত্র স্টেট পরিবর্তনের উপর প্রতিক্রিয়া জানানো হবে। AppMaster-এ আপনি ডেটা মডেল, ভিজ্যুয়াল বিজনেস প্রসেস হিসেবে evaluator তৈরি এবং স্টেট আপডেট থেকে নোটিফিকেশন/অ্যাসাইনমেন্ট ট্রিগার করতে পারেন — সবকিছু এক জায়গায় গঠিত থাকলে time math কেন্দ্রীভূত থাকে।