http://channel9.msdn.com/Events/Lang-NEXT/Lang-NEXT-2012/Why-and-How-People-Use-Rлекция John Cook на тему "Why and How People Use R".
Достоинства в лекции очевидны, поэтому остановимся на недостатках :)
Никак не могу согласится с оратором на тему, что в случае R, DSL в части D превосходит L. Опыт автора лекции почему то генезис R выводит от сплава Схемы и Фортрана. Хотя всем известно что второй компонентой R послужили конструкции APL(J,K).
Автор почему то боится сказать REPL, заменяя этот термин и указанием на единое пространство имен (что вообще то выглядит странно, R как Схема ограничена в этой области только фантазией пользователя), и на динамичность с краткостью. Более того все современные аналогичные продукты также вокруг REPL функционируют. Octave (Matlab), maxima (Matematica). Похоже что REPL это часть любой успешной сложной системы.
Про скорость мне понятно, что не зная и не пользуясь APL подобными конструкциями, автору остается только пользовать унылый for(). Неоднократно проводились показательные оптимизации практического кода показывающие, что в лучшем случае C код может обогнать код на R в пару раз. Но если пользоваться for(), то таки да 100 раз гарантированно :).
Является ли недостатком что R пишут статистики? DSL реализован поверх Лиспа, и заменить самописный лисп на один из написанных профессионалами не так уж и трудно. Например сейчас реализуют R поверх Scala (это такой лисп для ява машины).
PS про неэффективность использования памяти представления автора доклада также мягко говоря устарели. R позволяет работать с большими объемами данных. Для этого есть и специальные типы данных и эффективные операторы.