غالب اوقات طول عمر سیستم نرمافزاری صرف در استفاده میشود، نه صرف در طراحی و پیادهسازی. بنابراین، چرا عقل متعارف اصرار دارد که مهندسان نرمافزار عمدتا بر طراحی و توسعه سیستمهای محاسباتی بزرگ مقیاس(Large-Scale) تمرکز کنند؟
در این مجموعه تالیفات و مقالات، اعضای کلیدی تیم Google’s Site Reliability(اطمینانپذیری سایت گوگل) توضیح میدهند که چگونه و چرا تعهدشان به کل چرخه حیات، این شرکت را قادر به ساخت(Build)، استقرار(Deploy)، نظارت(Monitor) و حفظ برخی از بزرگترین سیستمهای نرمافزاری در جهان کرده است. شما [در این کتاب] اصول و شیوههایی را که مهندسان Google را قادر میسازند سیستمهای مقیاسپذیر(Scalable)، اطمینانپذیر(Reliable) و کارآمد(Efficient) را که به طور مستقیم برای سازمان شما قابل استفاده هستند، را بیاموزید.
این کتاب به چهار بخش تقسیم میشود:
- مقدمه – آموزش اینکه مهندسی اطمینانپذیری سایت(Site Reliability Engineering-SRE) چیست، و چرا متفاوت از شیوههای معمول صنعت فناوری اطلاعات است.
- اصول – بررسی الگوها، رفتارها و نگرانیهایی که بر کار یک مهندس Reliability سایت (SRE) تأثیر می گذارند.
- تمرینات – درک نظریه و عمل کار روزمره SRE: ساخت و بهزهبرداری از سیستمهای محاسباتی توزیع شده(Distributed) بزرگ.
- مدیریت – کاوشی روی بهترین شیوههای(Best Practice) گوگل برای آموزش، ارتباطات و جلسات که سازمان شما میتواند از آن استفاده کند.