جوړښت, ثانوي زده کړې او ښوونځي
نږدې ګاونډي لار وټاکئ: د کار د مثال په توګه
د نږدې ګاونډي طريقه اسانه متريک classifier ده کومه چې د بيلابيلو شيانو ورته د ارزونې پر بنسټ ده.
تحلیل څيز چې د ټولګي ته چې د دوی د روزنې د نمونې مضمونونو پورې اړه لري. راځئ چې معلوم ده چې د نږدې ګاونډي. هڅه وکړئ چې د پېچلې موضوع، د بیلو تخنیکونو مثالونو پوه شي.
فرضيه میتود
نږدې ګاونډي طريقه کولای شي د ټولو عام الګوریتم لپاره د ډلبندۍ کارول په توګه پام کې ونیول شي. Object لاندې طبقه چې د ټولګي y_i پورې اړه لري، چې نږدې څيز x_i نمونه زده.
د میتودونو نږدې ګاونډیانو مشخصوي
نږدې ګاونډي طريقه د ډلبندۍ د سموالي د ښه k. تحلیل څيز چې د خپلو ګاونډیو د عمده توګه د همدې ټولګي پورې اړه لري، چې، نږدې k ته دا د تحليل او نمونه x_i objects. په سره د ګاونډیانو د شمېر په دوو طبقو د ستونزو د حل به طاقو د ابهام حالت مخنیوی وي، که د ګاونډیانو او په همدې شمير به د بيلابيلو ټولګيو پورې اړه لري.
د ځنډول ګاونډیانو تخنیک
Postgresql-تحليل طريقه tsvector نږدې ګاونډیانو کارول کیږي کله چې د ټولګيو کې لږ تر لږه درې د شمیر، او تاسو کولای شي نه د طاقو شمېر وکاروي. خو ابهام هم په دغو مواردو کې راپورته شوی دی. نو، د I-مه ګاونډي w_i وزن، چې سره د ګاونډي رتبې زه کم شو. دا ته اشاره کوي د څيز ټولګي، چې به د نږدې ګاونډیانو په منځ کې په اعظمي توګه د ټول وزن لري.
د compactness فرضيه
د د پورته میتودونو د ټولو په زړه کې د compactness فرضيه دا ده. دا ښیي چې د شيانو ورته د اقدام او د همدې ټولګي پورې د هغوی تر منځ د تړاو. په دې حالت کې، د مختلفو ډولونو تر منځ د سرحد دی یو ساده فورم او په فضا کې د تړون د ګرځنده په سيمه کې د شيانو ټولګي جوړ کړي. دغه شان سيمو کې د رياضي د تحليل وړل د يوه تړلي bounded ټولګې په مانا ده. دا فرضيه دا ده چې اړوند د کلمې په ورځني درک نه.
د اساسي فورمول
راځئ چې نور د نژدي ګاونډي معاينه. که د وړانديز نمونه ډول "د څيز غبرګون» X ^ M = \ {(x_1، y_1)، \ خالونو، (x_m، y_m) \}؛ که د شيانو ماتو ته په لرې واټن کې دنده \ rho (x، x) تعريف له خوا د دندو د ارزښت د زياتوالي، د شيانو د يو مناسب موډل ورته په بڼه چې د استازيتوب x، x شيانو تر منځ کم ورته '.
د هر څيز، u به جوړ کړي د روزنې نمونه x_i سره د u واټن زياتوالي objects:
\ Rho (u، x_ {1؛ u}) \ leq \ rho (u، x_ {2؛ u}) \ leq \ cdots \ leq \ rho (u، x_ {متر؛ u})،
چې x_ {زه؛ u} د څيز د زده کړې نمونه، چې د I-مه ګاونډي سرچینه څيز u مشخصوي. چې ځواب دا ډول لاندنۍ او کارونې ته I-مه ګاونډي: y_ {زه؛ u}. د پایلې په توګه، موږ د موندلو چې د هر څيز u provokes خپل نمونه renumbering.
د ګاونډیانو شمېر K هوډ
نږدې ګاونډي طريقه کله چې د K = 1 ده د ورکولو یوه نصارا هم د ډلبندۍ، نه یوازې د شیانو-ګازونو، خو هم د نورو ټولګيو کې چې نژدې دي وړتيا لري.
که موږ واخلي = M K، د الګوریتم به د باثباته وي او به يو ثابت ارزښت وزغمی. له دې امله د اعتبار مهمه ده چې د مخنيوي افراطي له شاخصونو k.
په عمل کې، لکه څنګه چې د مطلوبو شاخص K کارول معیار جفتي کنترول.
نندارې ګازونو
د مطالعې شيانو دي په پراخه توګه نابرابره، خو د دوی په منځ کې شتون لري هغه کسان چې د يوه ټولګي د ځانګړتیاوې لري او د معیارونو ته راجع کیږي. د د د د د دې ټولګي پورې لوړ احتمال مطلوب موډل په موضوع نږدې.
د نږدې ګاونډیانو څنګه rezultativen طريقه؟ د مثال په توګه د شيانو دمحيطي بندونو او غیر معلوماتي کتګوریو کې پر بنسټ ليدل کيدای شي. دا د دې ټولګي د څيز نورو استازو ګڼ چاپیریال کی راوستله. کله چې تاسو د هغوی د کیفیت به رنځ نه د نمونې اخیستنې د طبقه له منځه یوسي.
تر لاسه کول يو د نمونې کیدای شي د شور تمامه چې "پر ځمکه" د یو ټولګي ټاکلي. لرې کول د طبقه د کیفیت د پام وړ مثبت اغېز لري.
که د نمونې څخه د uninformative او د له منځه وړلو د شور شيانو وړل، تاسو په ورته وخت کې یو څو مثبتې پایلې حساب کولای شي.
لومړی د interpolation طريقه نږدې ګاونډي د ډلبندۍ د کيفيت د ښه والي، د ساتل د معلوماتو اندازه کمه کړي، د طبقه، چې د بل د معیارونو د انتخاب ولګول شي د وخت په کموالي کې اجازه ورکوي.
د جویا د-لوی نمونو استعمال
نږدې ګاونډي طريقه داسې ده چي د زده کړې د شيانو دریښتینو د ساتلو پر بنسټ. ډېر په لویه کچه نمونې یوه تخنیکي ستونزه په کارولو سره جوړ کړي. هدف دا دی، نه دا چې د معلوماتو د پام وړ اندازه وژغوري، خو هم په لږ تر لږه د وخت اندازه چې د وخت د هر څيز u د نږدې ګاونډیانو په منځ کې k د موندلو لري.
چې په دې کار سره مقابله، دوه میتودونو څخه ګټه اخستل:
- يو رخصت غیر مالومات شيانو له لارې سپکه نمونه؛
- اغیزمن استعمال ځانګړي مالومات جوړښت او د نږدې ګاونډیانو فوري پلټنه کوډونو.
د انتخاب ميتودونو اصول
د پورته طبقه ګڼل کېدو. نږدې ګاونډي طريقه داسې ده چي په عملي ستونزې، چې په لرې واټن کې دنده \ rho مخکې په نامه د حل کارول (x، x). په تشریح شيانو شمېريزو vectors یو اقلیدس متريک وکاروي. دا انتخاب نه لري ځانګړي توجیه، خو شامل دي د ټولو نښو د اندازه کولو "په همدې کچه." که دا عامل په پام کې نه نیول، نو د متريک به ځانګړنه لري لوړه شمېريزو ارزښتونه برلاسي.
که د شکلونو په يوه د پام وړ اندازه، د د ځانګړو نښې نښانې د انحراف مجموعه په توګه د واټن محاسبه شته دی جدي ستونزه بعد ښکاري.
په لوړ بعدي فضا څخه بل به د ټولو شیانو لرې. په پای کې، د هر نمونه به د بل د څيز ته کېږي K ګاونډیانو زده کړې. د معلوماتي بڼې يو کم شمېر ټاکل د دې ستونزې د له منځه يوسي. د اټکل محاسبه الگوريتومونو د نښو مختلف سیټونه پر بنسټ جوړ، او د هر فرد د نږدې والي دنده جوړ کړي.
پایلې
د رياضي محاسبو اکثرا د يوه تخنيکونه چې د خپلو برجسته مشخصاتو، ګټې او زيانونه لري نوعه د ګټه اخیستنه ده. کتل نږدې ګاونډي طريقه خورا یوه جدي ستونزه له امله، د محاسبوي شيانو ځانګړنو حل کړي،. د آزمېښتي مفهوم پر بنسټ، د تحليل طريقه داسې ده چې په فعاله توګه په مصنوعي استخباراتو کارول.
په کارپوه سیستمونو دا ضروري نه یوازې د شیانو د طبقه، خو هم د پوښتنې د ډلبندۍ د توضیحاتو د ونډې ښکاره کول دی. په دغه طريقه، د دې پدیدې د توضیحاتو کې د یوه ځانګړي ټولګي څيز په توګه او همدارنګه د خپل ځای ته د نمونې کارول نسبي تړاو څرګند دي. حقوقي صنعت متخصصین، جیولوجستانو، ډاکټرانو، د دې "دود" منطق په فعاله توګه په خپلو څيړنو دا کار واخلي.
د دې لپاره چې تحليل شي طريقه وه تر ټولو د اعتماد وړ، کافی، د خوښې د پايلو په ورکولو، تاسو باید حد اقل شکل K واخلي، په داسې حال کې هم د تحليل شیانو په منځ کې او ګردونو څخه ډډه وکړي. دا چې ولې د معیارونو په کارولو او د انتخاب طريقه، او همدارنګه د ګټورول معيارونو.
Similar articles
Trending Now