هر سیستمی که راه میندازین، باید تمامی جنبه های اون رو بتونین مونیتور کنین. البته این مونیتور کردن بر اساس زیرسیستم های مختلف فرق داره. مثلا برای پهنای باند شبکه معمولا یک نمودار بلند مدت لازم هست و برای مثلا خطاهای سیستم، باید یه مونیتورینگ و سیستم هشدار وجود داشته باشه که 24*7 باشه. اما برای موارد دیگه، هنگام بوجود اومدن یک خطا یا مشکل یا مورد مشکوک، استفاده میشه. مثلا اینکه یه زیر سیستم درست کار نمیکنه، و میایم کارکرد اون رو تریس (trace) میکنیم.
هر سیستم عاملی دارای چندین لایه هست (البته منظورم الزاما معماری لایه ای نیست) که هرکدوم یه وظیفه خاص رو بر عهده دارن. یکی مسئول لایه 2 شبکه و یکی مسئول لایه 3. هر کدوم نیازمند سیستم مونیتورینگ جداگانه هست. مثلا میخوایم بدونیم تو لایه 2 وضعیت چطور هست، باید از ethtool و ابزارهای مشابه استفاده کنیم. اینکه ادمین با این ابزارها آشنا باشه، یه مساله حیاتی هست. اما خب، سخت هست. تعداد این ابزارهای زیاده و شناخت اینکه این ابزارها دقیقا چکار میتونن انجام بدن نیاز به تجربه خیلی زیادی داره.
تو عکس زیر میتونین برای هر لایه ابزارهای موجود رو ملاحظه کنین و در صورت نیاز کارکرد اونها رو با man مطالعه کنین.