Automatic Jira Task Estimation based on the Azure Machine Learning Predictive Modeltopjankari.com

Automatic Jira Task Estimation based on the Azure Machine Learning Predictive Model

Automatic Jira Task Estimation based on the Azure Machine Learning Predictive Model.

save water save tree !

हाल के वर्षों में मशीन लर्निंग हमारे जीवन के हर क्षेत्र में तेजी से प्रवेश कर रही है। तस्वीरों और आवाज़ों की पहचान से, बुद्धिमान संकेत और सुझाव ऑनलाइन और यहां तक ​​कि हमारी कारों में भी। Mckinsey.com द्वारा किए गए एक अध्ययन के मुताबिक, 2030 तक, 30% काम जो लोग वर्तमान में करते हैं उन्हें मशीनों द्वारा लिया जाएगा। सॉफ्टवेयर कंपनियों में यह और भी अधिक होगा। खराब स्थिति परिदृश्य - आपको डर है कि वे आपको अपने पसंदीदा नौकरी से अनावश्यक बना देंगे, और वे आपको मशीनों के साथ बदल देंगे। ऐसा मत सोचो। मशीन आपको अधिक अभिनव चीजों पर ध्यान केंद्रित करने के लिए छोड़कर मूल कार्य को ले जाएगी। और इस तरह एआई हमारे दैनिक प्रशासनिक कार्यों का समर्थन कर सकता है ... चलो आइज़र मशीन लर्निंग पूर्वानुमान मॉडल के आधार पर जिरा कार्य अनुमान पर नज़र डालें।

AI powered planning with Jira

हम महीने में दो बार बैकलॉग कार्यों का अनुमान लगाते हैं। 5 घंटे की एक टीम के लिए जो 10 घंटे है, और मासिक आधार पर योजना के 20 घंटे। यह काफी है, यह देखते हुए कि प्रोग्रामर, उम्मीद है कि औसतन 30 अमरीकी डालर प्रति घंटे कमाता है। सालाना इसका मतलब है कि अकेले नियोजन पर खर्च किए गए 8 हजार अमरीकी डालर। इस मामले में, विभिन्न विभागों के 4 अतिरिक्त लोग योजना में भाग लेते हैं क्योंकि वे ग्राहक को सॉफ्टवेयर देने की पूरी प्रक्रिया के लिए ज़िम्मेदार हैं।

एक ओर, योजना के बिना, परियोजना निश्चित रूप से ऐसा नहीं दिखती है। और अनिवार्य रूप से, जटिलता और संरचना का स्तर समय के साथ घट जाएगा। दूसरी तरफ ... तथाकथित "मीटिंग डे" जैसे कुछ प्रोग्रामर। यह वह दिन है जब आप उन सभी चीजों के बारे में सोचते हैं जो आप कर सकते थे, लेकिन ऐसा नहीं कर सकते क्योंकि आप एक बैठक में हैं।

जिरा एक अच्छी तरह से संरचित उपकरण है जहां कई प्रक्रियाओं को सरल बनाया जा सकता है, लेकिन शायद जिरा खुद ही कुछ और दे सकता है। आपके पास 200 कार्यों का बैकलॉग है। आप कार्य की सामग्री पढ़ते हैं। 5 सेकंड के बाद आप जानते हैं, कम या ज्यादा, प्रत्येक कार्य को पूरा करने में आपको कितना समय लगेगा (जब तक सामग्री स्पष्ट रूप से, संक्षेप में और स्पष्ट रूप से लिखी जाती है)। स्पष्ट स्थिति - कार्य की कीमत है, आप अगले कार्य पर जाते हैं। यह एक पंक्ति में एक और कार्य है जिसकी कीमत 3 स्टोरी पॉइंट्स है। आपने पहले ही 20 समान कार्य किए हैं।

Azure Machine Learning Planning  – Configuration Model

हमारी योजना प्रक्रिया में एज़ूर मशीन लर्निंग को शामिल करने का पहला कदम जिरा से सीएसवी तक मौजूदा कार्यों को निर्यात करना है ताकि उनका विश्लेषण किया जा सके। दुर्भाग्यवश, जिरा सीएसवी फ़ाइल को ऐसे तरीके से निर्यात करती है जो हम अपेक्षा करते हैं। फ़ाइल बहुत गंदा है (रिक्त स्थान, टैब, प्रवेश, एचटीएमएल कोड)। Azure एमएल इसे ठीक से आयात नहीं कर सकता है। इसके अतिरिक्त, टीम ने फिबोनाची अनुक्रम के अनुसार 0,1,2,3,5,8,13 के पैमाने पर कार्यों की सराहना की। हमारी गणना के लिए यह एक बड़ा अंतर है - हम इसे आसान (1), मेडियम (3), डिफिक्लिक (5) के रूप में सरल बना देंगे।

चूंकि हमारी जेएस स्क्रिप्ट ने हमें फ़ाइल को पूर्व-तैयार करने में मदद की है, इसलिए अब हमें इसे अधिक विश्लेषण के लिए तैयार करना होगा।

Steps we have already taken:

  • merge title with description,

  • drop html tags (this step will be explained later),

  • replace numbers,

  • remove special chars.

Steps we need to take now:

  • remove duplicate chars,

  • convert to lower case,

  • stem the words: driver, drive, drove, driven, drives, driving becoming drive,

  • remove stopwords (that, did, and, should …).

Verification process

आगे के कदम जो मैंने नहीं किए हैं, लेकिन वे अंतिम परिणाम को काफी प्रभावित कर सकते हैं। अनुमान की सच्चाई को सत्यापित करने के लिए इसे एक-एक करके संलग्न करना और अंतिम प्रभाव को सत्यापित करना आवश्यक है।

एचटीएमएल टैग काट न लें (प्रोजेक्ट में फ्रंटेंडर्स के लिए कार्य हैं, जहां कभी-कभी कार्य टैग के अनुमान में एचटीएमएल टैग का मुख्य अर्थ होता है)।
कुछ कार्यों में फ्रांसीसी शब्द हैं - यह संदिग्ध है कि वे महत्वपूर्ण हैं, यहां हमें जिरा में परियोजना प्रबंधन के स्तर पर परिवर्तन करना चाहिए।
फ्रंटेंड और बैकएंड कार्यों का पृथक्करण। वर्तमान में, इस तथ्य के बावजूद कि प्रत्येक कार्य का अपना ईपीआईसी है, हम इसे संलग्न नहीं करते हैं, इसलिए सामने और पीछे के कार्यों को एक बैकलॉग में जोड़ा जाता है।
कार्यों की संख्या बहुत छोटी है - बेहतर मॉडल बेहतर काम करता है

The current Azure ML scheme is as follows

After making all the necessary modifications, the sentence that initially looked like this:

Create table to log user last logins. This omit issue with locks on user table

Is changed to:

creat tabl log user login omit issu lock user tabl

Below is a graph of word statistics for tasks larger than 5SP.

The next step is to analyze the words from two angles.

 

Unigram – एक विधि जो शब्दों की सभी घटनाओं की गणना करती है। हमारे मामले में, विधि अप्रभावी साबित हो सकती है, क्योंकि "आवेदन फ़ॉर्म के तहत फ़ॉन्ट बदलें" की सामग्री। - 1 एसपी और "आवेदन पत्र के तहत दो नए बाल रूपों को जोड़ें" में "एसपी अंक" शब्द "आवेदन पत्र" है जिसमें एक बार 1SP और दूसरा 5SP है।

Bigram, Trigram, N-gram – एन शब्द आंकड़ों के आधार पर, जहां एन 2, 3 और इसी तरह है।

मैंने एन-ग्राम विधि चुना, जो अधिक प्रभावी साबित हुआ।

एन-ग्राम विश्लेषण में हम तारों की तुलना करना बंद कर देते हैं, और हैश पर स्विच करते हैं - यह तुलना तेजी से काम करती है, और क्योंकि हमारा डेटाबेस समय के साथ बढ़ता जा रहा है, तुलना तेजी से होगी।

एक बार एन-ग्राम विश्लेषण बनने के बाद, हम अपने मॉडल को बना और प्रशिक्षित कर सकते हैं, 70% डेटा डेटा को प्रशिक्षित करने के लिए डेटा ले सकते हैं, और 30% परीक्षण डेटा के रूप में ले सकते हैं।

अंतिम चरण हमारी योजना को विश्लेषण में सामग्री पेश करने की क्षमता प्रदान करना है, और मॉडल द्वारा अनुरूपित कठिनाई का स्तर दिखाना है।

Here are the results:

  •  oAuth Refresh token doesn’t work – Azure ML – easy – friends – easy

  • Add BBcode feature to the form – Azure ML – easy – friends easy

  • Fix the styles for upload button – Azure ML – easy – friends – easy

  • Message form refactor – Azure ML – difficult – friends – difficult

  • Random string method has many implementations – unify them into one – Azure ML – easy – friends – easy

Link