Ban đầu, một vài người rất háo hức
về R, và muốn tìm hiểu luôn và ngay. Tuy nhiên, không biết nên bắt đầu từ đâu.
Bởi, khi gặp những khó khăn ban đầu - “văn phạm ngôn ngữ trong R”, nhiều người
sẽ nản, nản dần, và thậm chí là “bỏ cuộc”. Trường hợp một anh, khi biết tôi tự
tìm hiểu về R, tự học, tự mày mò, và sau một thời gian có những thành quả ban
đầu (xử lý số liệu, vẽ biểu đồ trên R) nên rất muốn tìm hiểu về R. Qua tôi, tôi
coppy hết những tài liệu, bài giảng, và những video liên quan đến R, đặc biệt
là những bài giảng của GS Nguyễn Văn Tuấn trên youtube. Có những gì tôi chia sẻ
hết. Một người, hai người, và trên hai người. Không dừng ở đó, những dữ liệu,
bài viết có liên quan, và những câu lệnh sử dụng để xử lý, vẽ biểu đồ tôi cũng
cung cấp để anh có thể thực hành. Và, anh và một vài người khác đã phải dừng cuộc
chơi (bỏ cuộc với R).
Ở góc độ cá nhân, mình không “sành”,
và càng không phải dân chuyên “thống kê” và phân tích dữ liệu, có chăng chỉ là
tự tìm hiểu để xử lý dữ liệu, vẽ biểu đồ... liên quan đến công việc. Sẽ là rất
khó cho những ai mới tiếp cận với R, và mình đã ít nhiều trải qua thời điểm đó.
Bây giờ lên mạng (google) gõ ra các tài liệu liên quan về R thì vô kể. Tuy
nhiên, khi mới bắt đầu tiếp cận, chúng ta thường không biết bắt đầu từ đâu. Các
tài liệu hướng dẫn cũng chưa chú thích kỹ: chúng ta nên tiếp cận với R như thế
nào? Xuất phát từ trăn trở đó, trong cái note này và những cái note tiếp theo
(nếu có thể) mình sẽ chia sẻ những trải nghiệm của cá nhân về việc tìm hiểu, tập
tành, và “bắt chước” với R như thế nào?
Trước tiên, nên có một vài cuốn
sách (tiếng việt, tiếng anh) có liên quan về R. Theo mình, nên có cuốn “Phân
tích dữ liệu với R (518 trang) - Nguyễn Văn Tuấn”. Với nội dung khá rộng, và với
nỗ lực rất lớn, tác giả lần lượt giới thiệu đến người đọc TỪ những khái niệm,
ngôn ngữ R, văn phạm trong R; cách nhập, biên tập dữ liệu; các phép tính toán
đơn giản; các phương pháp phân tích và mô hình thống kê phổ biến... ĐẾN các
phương pháp, mô hình phân tích tổng hợp, hiện đại, và đặc biệt hơn cả là các nội
dung về thống kê và phương pháp phân tích dữ liệu có liên quan, và áp dụng hoàn
toàn trên R hoặc Rstudio. Từ đó, bạn nên dành thời gian để đọc, tìm hiểu về
ngôn ngữ, văn phạm, và cách vận hành trên R. Vừa đọc, vừa tìm hiểu, và gõ thử,
viết lại (bắt chước) những câu lệnh đơn giản trên cửa sổ của R. Một lần. Hai lần.
Vài lần. Dần dà sẽ hiểu dần về cách vận hành của R.
Việc đọc, tìm hiểu tài liệu phải
luôn đi kèm với tập tành (thực hành) trên máy tính có chạy chương trình với R.
Bắt chước từ những cái đơn giản nhất. Cài đặt vào máy tính. Khởi động và thoát
(tắt). Những hỗ trợ trong R. Tập gõ (viết lại) những phép tính đơn giản nhất (cộng
trừ nhân chia; những ký hiệu thường dùng trong R), và đặc biệt là hiểu được cách
vận hành trong R. Nói đến đây, hẳn không chỉ đơn giản bằng một vài câu nói. Đó
là một chuỗi những khó khăn ban đầu mà không đơn giản chút nào. Thực tình, trước
đó mình cũng mất khá nhiều thời gian cho những bước chân chập chững mới bước
vào môi trường với R. Tuy nhiên, “R không
dành cho những người... dễ dãi - Bs Trần Quý Phi”, đủ biết bạn phải dành thời
gian, kiên trì, và đặc biệt là phải thường xuyên sử dụng R, mà trước đó mình có
đề cập (cóp nhặt) trong cái note giới thiệu cuốn sách của GS Nguyễn Văn Tuấn “Phân tích dữ liệu với R”.
Trên đây là một vài thông tin sơ khỏi
cho những bước chân chập chững đang tập đi trên những con đường vô vàn khó khăn
trong môi trường vận hành cũng như những ứng dụng to lớn bằng R, đặc biệt là thời
đại “big data”. Ở những cái note sau mình sẽ tâm sự những bước tập đi tiếp theo
trong môi trường và ứng dụng với R.
hãy tham khảo : https://maybamgoblog.wordpress.com/2017/12/15/thong-so-ki-thuat-may-bam-go-di-dong/
ReplyDelete