Tuesday, 11 July 2017

Ban đầu, một vài người rất háo hức về R, và muốn tìm hiểu luôn và ngay. Tuy nhiên, không biết nên bắt đầu từ đâu. Bởi, khi gặp những khó khăn ban đầu - “văn phạm ngôn ngữ trong R”, nhiều người sẽ nản, nản dần, và thậm chí là “bỏ cuộc”. Trường hợp một anh, khi biết tôi tự tìm hiểu về R, tự học, tự mày mò, và sau một thời gian có những thành quả ban đầu (xử lý số liệu, vẽ biểu đồ trên R) nên rất muốn tìm hiểu về R. Qua tôi, tôi coppy hết những tài liệu, bài giảng, và những video liên quan đến R, đặc biệt là những bài giảng của GS Nguyễn Văn Tuấn trên youtube. Có những gì tôi chia sẻ hết. Một người, hai người, và trên hai người. Không dừng ở đó, những dữ liệu, bài viết có liên quan, và những câu lệnh sử dụng để xử lý, vẽ biểu đồ tôi cũng cung cấp để anh có thể thực hành. Và, anh và một vài người khác đã phải dừng cuộc chơi (bỏ cuộc với R).

Ở góc độ cá nhân, mình không “sành”, và càng không phải dân chuyên “thống kê” và phân tích dữ liệu, có chăng chỉ là tự tìm hiểu để xử lý dữ liệu, vẽ biểu đồ... liên quan đến công việc. Sẽ là rất khó cho những ai mới tiếp cận với R, và mình đã ít nhiều trải qua thời điểm đó. Bây giờ lên mạng (google) gõ ra các tài liệu liên quan về R thì vô kể. Tuy nhiên, khi mới bắt đầu tiếp cận, chúng ta thường không biết bắt đầu từ đâu. Các tài liệu hướng dẫn cũng chưa chú thích kỹ: chúng ta nên tiếp cận với R như thế nào? Xuất phát từ trăn trở đó, trong cái note này và những cái note tiếp theo (nếu có thể) mình sẽ chia sẻ những trải nghiệm của cá nhân về việc tìm hiểu, tập tành, và “bắt chước” với R như thế nào?

Trước tiên, nên có một vài cuốn sách (tiếng việt, tiếng anh) có liên quan về R. Theo mình, nên có cuốn “Phân tích dữ liệu với R (518 trang) - Nguyễn Văn Tuấn”. Với nội dung khá rộng, và với nỗ lực rất lớn, tác giả lần lượt giới thiệu đến người đọc TỪ những khái niệm, ngôn ngữ R, văn phạm trong R; cách nhập, biên tập dữ liệu; các phép tính toán đơn giản; các phương pháp phân tích và mô hình thống kê phổ biến... ĐẾN các phương pháp, mô hình phân tích tổng hợp, hiện đại, và đặc biệt hơn cả là các nội dung về thống kê và phương pháp phân tích dữ liệu có liên quan, và áp dụng hoàn toàn trên R hoặc Rstudio. Từ đó, bạn nên dành thời gian để đọc, tìm hiểu về ngôn ngữ, văn phạm, và cách vận hành trên R. Vừa đọc, vừa tìm hiểu, và gõ thử, viết lại (bắt chước) những câu lệnh đơn giản trên cửa sổ của R. Một lần. Hai lần. Vài lần. Dần dà sẽ hiểu dần về cách vận hành của R.

Việc đọc, tìm hiểu tài liệu phải luôn đi kèm với tập tành (thực hành) trên máy tính có chạy chương trình với R. Bắt chước từ những cái đơn giản nhất. Cài đặt vào máy tính. Khởi động và thoát (tắt). Những hỗ trợ trong R. Tập gõ (viết lại) những phép tính đơn giản nhất (cộng trừ nhân chia; những ký hiệu thường dùng trong R), và đặc biệt là hiểu được cách vận hành trong R. Nói đến đây, hẳn không chỉ đơn giản bằng một vài câu nói. Đó là một chuỗi những khó khăn ban đầu mà không đơn giản chút nào. Thực tình, trước đó mình cũng mất khá nhiều thời gian cho những bước chân chập chững mới bước vào môi trường với R. Tuy nhiên, “R không dành cho những người... dễ dãi - Bs Trần Quý Phi”, đủ biết bạn phải dành thời gian, kiên trì, và đặc biệt là phải thường xuyên sử dụng R, mà trước đó mình có đề cập (cóp nhặt) trong cái note giới thiệu cuốn sách của GS Nguyễn Văn Tuấn “Phân tích dữ liệu với R”.

Trên đây là một vài thông tin sơ khỏi cho những bước chân chập chững đang tập đi trên những con đường vô vàn khó khăn trong môi trường vận hành cũng như những ứng dụng to lớn bằng R, đặc biệt là thời đại “big data”. Ở những cái note sau mình sẽ tâm sự những bước tập đi tiếp theo trong môi trường và ứng dụng với R.

1 comment:

  1. hãy tham khảo : https://maybamgoblog.wordpress.com/2017/12/15/thong-so-ki-thuat-may-bam-go-di-dong/

    ReplyDelete

Powered by Blogger.

Contact Form

Name

Email *

Message *

Pages - Menu

Popular

Total Pageviews

Popular Posts

Recent Posts

Text Widget