close
所以,以下幾個狀態萬國翻譯公司會建議先嘗嘗R:
- 探索性工作:想快速摸索資料集的特性,試用一些常見算法的結果,以決定後續的闡明體例翻譯
- 要在既有模型上做優化:R供給更多的優化選項與更好的社群撐持
- 大量的統計背景或統計工作:如 parameter/interval estimation
至於Python呢,我的建議是:
- 快速Prototyping:Python跟其他語言/GUI接合對照方便,假如要快速做出可展現的系統,用Python較輕易。
- 渙散式處置懲罰:如果資料量很大,用Python會比用R更輕易將資料divide & counquer,不外資料如果真的很大,照舊先斟酌一下Hadoop/Mahout比力實際...
- 只需要利用常見的資料分析模子時
以R來講,這是設計給統計範疇的人做資料分析的語言翻譯學過其他說話的人會發現R有很多奇異的內建型別,像是:
- Factor:這是R的一種資料型別,默示這資料是屬於種別變數(Categorical variable),有別於陸續變數(Continuous Variable)
- Formula:透露表現一個公式,如y相依於x可以表示成"y ~ x"
辨別這些內建型別對於統計來講是很自然的,因為這些物件在統計上都有分歧的用處與操作體例。但是其他說話是很少會內建這些東西的。
另外,在R的社群問Data Analysis問題的話會比較能獲得謎底,這應當也算是個長處。
R的問題之一在於延展性,所以較量爭論與暫存資料預設都是利用Memory,所以Memory不夠大的話,能處置的資料集巨細也會受限。雖然有一些公司在改進這個弱點,但我不肯定是否這些公司的產品是不是能闡揚影響力。
說其實的,萬國翻譯公司兩個都不是很熟XD,所以我只能很不專業的比較。
這兩種都是Data Analysis常用的程式說話,想知道更多的話可以參考以下這幾本O'reilly的書翻譯
- Python for Data Analysis (Python)
- Machine Learning For Hackers (R)
- Data Analysis with Open Source Tools (R and Python)
文章標籤
全站熱搜