經(jīng)常有人問我們,日常常見問題有哪些,如何解決?您可想象,我們(云絡(luò)網(wǎng)絡(luò))是全球最大的大型互聯(lián)網(wǎng)系統(tǒng)外包服務(wù)運(yùn)營商,所以幾乎碰到過所有問題。
我們運(yùn)行各類游戲、電商、移動(dòng)通訊、廣告、財(cái)經(jīng)、社交活動(dòng)、旅游及其它多種網(wǎng)站,所以在各種系統(tǒng)平臺(tái)上碰到過各種各樣的問題。在全球十幾個(gè)國家有幾百萬用戶,每秒需處理幾千個(gè)事務(wù),系統(tǒng)問題及系統(tǒng)崩潰常有發(fā)生、避之不及。
但是,有些共性問題是我們經(jīng)常碰到,經(jīng)常處理的,基本上這些問題可以歸結(jié)為四大類問題,如可靠性問題、系統(tǒng)性能和系統(tǒng)擴(kuò)展問題、系統(tǒng)安全問題以及成本問題。
可靠性問題
對(duì)于可靠性問題,其產(chǎn)生根源眾多,如過載、代碼問題、服務(wù)器崩潰、數(shù)據(jù)庫問題、帶寬、硬件、云問題、CDN、數(shù)據(jù)中心問題等。我們也見證過一些系統(tǒng)更新,還未經(jīng)完善測試便加以運(yùn)用所帶來的問題,這些問題是人為的,由程序員、內(nèi)容編輯人員、游戲開發(fā)人員甚至是我們的成員所造成的。
從長遠(yuǎn)來看,我們最大的也是經(jīng)常碰到的問題便是磁盤空間問題?蛻魯(shù)量激增、博客量也驟增。不管你提供多大的磁盤空間,為了處理數(shù)據(jù)及其它事務(wù),他們會(huì)把磁盤空間消耗殆盡。所以,我們就像其它的系統(tǒng)管理員一樣,竭盡所能,想盡一切辦法增大磁盤、增加存儲(chǔ)空間。所幸的是當(dāng)今的3TB 磁盤真的很大,可不幸的是數(shù)據(jù)文件也很大而且采用云儲(chǔ)存代價(jià)很高。所以我們經(jīng)常接到此類通知,配合客戶需求,手動(dòng)或自動(dòng)清理存儲(chǔ)空間。
數(shù)據(jù)庫問題是另一個(gè)司空見慣的問題。從過載到常見的復(fù)制問題?蛻艚(jīng)常誤解復(fù)制、不明白復(fù)制需求及復(fù)制效果,所以經(jīng)常產(chǎn)生問題,而我們也就一直不斷地來解決這些問題,包括使用新型的探測、監(jiān)控及管理工具使系統(tǒng)正常運(yùn)行、保證數(shù)據(jù)準(zhǔn)確性。這一工作變得越來越重要,因?yàn)閿?shù)據(jù)在電子商務(wù)及廣告業(yè)變得越來越關(guān)鍵、越來越面向財(cái)務(wù)。
其它的可靠性問題還包括PHP, Java 及其它Django問題,當(dāng)然還包括系統(tǒng)崩潰以及我們?nèi)粘1O(jiān)控、管理及解決的問題。特別對(duì)于中國而言,我們每天要處理的主要問題就是帶寬問題,帶寬時(shí)而好、時(shí)而差、時(shí)而又恢復(fù)正常。 同時(shí),在中國某些地區(qū),帶寬問題一直存在,前一秒連接的很好,后一秒就斷線了。在今天,要恢復(fù)連接,通常至少要聯(lián)系數(shù)據(jù)中心、電信部門、還要弄清楚要連接什么和什么。
系統(tǒng)性能和可擴(kuò)展性問題
系統(tǒng)性能問題包括超負(fù)荷,就是常見的CPU、RAM 及IO 被大量占用;很多用戶(有時(shí)是同一天同一時(shí)間)登錄到客戶網(wǎng)站造成了各種問題。在無邊無際的互聯(lián)網(wǎng)世界中,可謂事事難料、變幻莫測。
經(jīng)常碰到的問題就是:
寫的很差的PHP代碼突然增加了負(fù)載,造成系統(tǒng)CPU不夠;或某些程序占用空間大,導(dǎo)致RAM不夠;以及SQL很差,沒有索引,使數(shù)據(jù)庫崩潰,無法處理并發(fā)事件、上鎖甚至是進(jìn)行輸入輸出操作。
系統(tǒng)擴(kuò)展問題有別于其它問題,為應(yīng)付未來幾天、幾周甚至幾個(gè)月的事務(wù)增長,而需快速建立或擴(kuò)展系統(tǒng)時(shí),更需另當(dāng)別論。因?yàn)橥ǔG闆r下,系統(tǒng)架構(gòu)時(shí)并未考慮此事,負(fù)載均衡做的很差,甚至沒有負(fù)載均衡,或者是沒有便攜式PHP/Java會(huì)話而導(dǎo)致無法實(shí)現(xiàn)均衡。
經(jīng)常有客戶到我們這里說,他們的系統(tǒng)遇到“瓶頸”了,前一分鐘還運(yùn)行的很好,然后,突然有一天因?yàn)檫^載崩潰了。從理論上說,不應(yīng)該出現(xiàn)這種情況,但是,如果使用的監(jiān)控軟件很差,無法顯示系統(tǒng)是否接近系統(tǒng)上限的話,那么這種情況就會(huì)經(jīng)常發(fā)生。不幸的是,系統(tǒng)CPU使用量在95%和100%時(shí),用戶體驗(yàn)是截然不同的:95%時(shí),可能系統(tǒng)運(yùn)行的有點(diǎn)慢,而在100%時(shí),系統(tǒng)就根本無法工作。
系統(tǒng)安全問題
系統(tǒng)安全一直是一個(gè)挑戰(zhàn),雖然我們的系統(tǒng)從總體上來說很安全,但是,我們的客戶使用的代碼不安全,使用的附加工具,如Cpanel 或各類管理界面如PHPMyAdmin 也不安全。所以,我們一不留神,這些壞蛋就有了可乘之機(jī),有道是:“千里之堤毀于蟻穴!
所幸的是,我們的安全是多層次的,而且所分配的權(quán)限是最低的,所以,對(duì)系統(tǒng)安全的破壞性很少發(fā)生。但是,偶爾也會(huì)有系統(tǒng)破壞,我們就必須清理系統(tǒng),更改授權(quán),增加客戶日志及安全監(jiān)控器等等。有時(shí),我們還做審計(jì)工作,查看是否有黑客存在及其藏匿位置。
成本問題
最后,我們經(jīng)常遇見的問題就是如何節(jié)省開支。這不算是技術(shù)問題,但是,我們經(jīng)常發(fā)現(xiàn)客戶在系統(tǒng)及服務(wù)器上花費(fèi)頗多,甚至花過多的冤枉錢。他們會(huì)因?yàn)橄到y(tǒng)慢,自己不知道如何解決或調(diào)試系統(tǒng);或者雖然站點(diǎn)功能頗多,但是卻不知道如何將其虛擬化并置于私云中,所以就采購了許多服務(wù)器。
在此,我們通過調(diào)試系統(tǒng)便可以對(duì)其進(jìn)行擴(kuò)展,而無需購買新系統(tǒng),或者以更經(jīng)濟(jì)的創(chuàng)建私云的方式擴(kuò)展系統(tǒng),便可為客戶節(jié)省大量開支。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:云計(jì)算系統(tǒng)管理的四大常見問題
本文網(wǎng)址:http://www.oesoe.com/html/support/1112189805.html