Đế chế dữ liệu của Facebook nguy hiểm như thế nào?


Là một nền tảng miễn phí, Facebook lấy gì để “nuôi thân”? Đúng vậy, chính là sử dụng dữ liệu mà bạn đã cung cấp một cách tự nguyện.

Xử lý dữ liệu là nguồn thu nhập lớn nhất của Facebook. Trong năm 2016, công ty đã kiếm được 6,4 tỷ USD từ mảng quảng cáo, đánh dấu sự tăng trưởng 63% so với năm trước.

Có rất ít người nhận ra được mức độ thu thập dữ liệu của Facebook một cách chính xác. Bên cạnh việc xử lý thông tin trên trang cá nhân, Facebook còn theo dõi bạn ở bên ngoài phạm vi nền tảng của mình (offsite) và mua thông tin về hoạt động ngoại tuyến của bạn từ các bên thứ ba. Nhờ sức mạnh có được từ những nguồn này, Facebook có thể xây dựng nên những hồ sơ khách hàng chi tiết đến mức nó có thể làm dấy lên nhiều mối lo ngại về quyền riêng tư.

Những dữ liệu nào được thu thập?

Chính sách sử dụng dữ liệu của Facebook (được sửa đổi lần cuối vào ngày 29/9/2016) có nêu rõ các loại thông tin mà nó thu thập về bạn. Một số được thu thập ở ngay trên trang Facebook (onsite), còn lại là dữ liệu ngoài phạm vi nền tảng (offsite).

1.     Dữ liệu onsite

     – Tất cả những gì mà bạn chia sẻ trên Facebook, bao gồm chi tiết thông tin tài khoản, những bài đăng do bạn viết, vị trí và ngày tháng chụp ảnh, cách bạn sử dụng Facebook (như loại nội dung mà bạn yêu thích, tần suất giao tiếp, và bạn thường xuyên giao tiếp với những ai).

     – Tất cả những gì người khác nói về bạn, bao gồm ảnh, tin nhắn và các bài đăng.

     – Các nhóm mà bạn tham gia, bao gồm dữ liệu về cách bạn tương tác với họ và thông tin liên lạc (ví dụ như địa chỉ) mà bạn đăng lên.

     – Thông tin tín dụng, như kiểu thanh toán mà bạn đã thực hiện, thông tin thẻ tín dụng (số thẻ, mã bảo mật,…) cũng như hóa đơn và chi tiết giao hàng.

2.     Dữ liệu offsite

     – Tất cả thông tin về thiết bị của bạn, như hệ điều hành, phiên bản phần cứng, cài đặt của thiết bị, tên và loại phần mềm, pin và tín hiệu sóng, số hiệu thiết bị, địa chỉ thông qua GPS, tên nhà mạng sử dụng, loại trình duyệt sử dụng, ngôn ngữ và múi giờ, số điện thoại di động và địa chỉ IP.

     – Thông tin từ các trang web và ứng dụng bên thứ ba có liên kết với Facebook, chẳng hạn như các trò chơi nền web. Thông tin bao gồm những trang web và ứng dụng mà bạn truy cập.

     – Thông tin được cung cấp bởi các đối tác bên thứ ba, chẳng hạn như các nhà quảng cáo hoặc các nhà môi giới dữ liệu.

     – Thông tin được cung cấp bởi các công ty khác thuộc sở hữu của Facebook.

Các công ty thuộc quyền sở hữu của Facebook

1.     Facebook Payment Inc.

2.     Atlas

3.     Instagram LLC

4.     Onavo

5.     Moves Oculus

6.     WhatsApp Inc.

7.     Masquerade

8.     CrowdTangle

Dữ liệu được thu thập như thế nào?

Một số kỹ thuật thu thập dữ liệu, đơn giản như lưu thông tin tài khoản hoặc nhật ký hoạt động trên Facebook là khá hiển nhiên. Những kỹ thuật khác thì không được rõ ràng như vậy.

Năm 2015, Facebook đã thua một vụ kiện tại Bỉ, liên quan đến việc thu thập dữ liệu của mình. Một nhóm các nhà nghiên cứu đến từ Đại học Leuven và Brussels đã kết luận rằng mỗi khi một người truy cập một trang Facebook hay một trang web có dùng nút Facebook Like, một cookie (một đoạn văn bản ghi thông tin được tạo ra và lưu trên trình duyệt của máy người dùng) có tên datr được lưu trữ một cách bí mật trên trình duyệt – ngay cả trên trình duyệt của người không sử dụng Facebook. Cookie này được thiết kế để tồn tại trong thời gian 2 năm, đồng thời theo dõi tất cả các hoạt động duyệt web của người dùng. Tòa án đã quyết định rằng việc thu thập thông tin của người dùng mà không được sự đồng ý của họ là vi phạm quy định của EU. Năm 2016, Facebook đã kháng cáo thành công khi lập luận rằng họ có trụ sở chính tại châu Âu được đặt ở Ireland nên tòa án Bỉ không có quyền hành phán xét họ. Do vậy, Facebook vẫn được phép tự do theo dõi người dùng (và thậm chí cả những người không phải người dùng) của mình.

Để hồ sơ người dùng trở nên chi tiết hơn nữa, Facebook còn mua thông tin về các hoạt động trực tuyến và ngoại tuyến của bạn từ các bên thứ ba.

Facebook và các nhà môi giới dữ liệu bên thứ ba

Thu thập dữ liệu là một ngành công nghiệp khổng lồ hoạt động trong bóng tối. Các nhà môi giới dữ liệu là những công ty thu thập và phân tích các dữ liệu công khai để xây dựng hồ sơ chi tiết về người dùng. Những hồ sơ này có thể chứa các thông tin như bạn có nuôi chó hay không, bạn thích trà của hãng nào, cỡ giày, bạn đang mang thai hay không, và thói quen mua sắm bằng thẻ tín dụng. Theo New York Times, Acxiom, một trong những công ty môi giới dữ liệu lớn nhất thế giới, người dùng được phân chia thành các nhóm rất nhạy cảm như “người thừa kế tiềm năng”, “người trưởng thành với bố mẹ có chức có quyền”, “đang ăn kiêng”, “thích bài bạc”, “đang cần tiền” và “có hút thuốc lá”.

Làm thế nào mà các nhà môi giới này có thể thu thập thông tin về bạn? Họ lấy chúng từ dữ liệu mở của chính phủ (ví dụ, nếu bạn thực hiện quyên góp chính trị), các thông tin công khai (hồ sơ cá nhân trên mạng xã hội), và dữ liệu thương mại (những thanh toán do bạn thực hiện). Bất kì cuộc thi, khảo sát, bảo hành, thanh toán bằng thẻ hay thậm chí là đăng kí dịch vụ (subscription) đều được tính đến. Những dữ liệu này được cung cấp cho các thuật toán phức tạp, từ đó phân loại bạn theo nhiều hạng mục khác nhau.

Thu thập dữ liệu là việc rất phổ biến tại Mỹ, nơi luật bảo vệ dữ liệu vẫn chưa được hoàn thiện. Các công ty môi giới dữ liệu thậm chí không có nghĩa vụ phải cho bạn thấy rằng hồ sơ thông tin của họ về bạn có chứa những gì. Ngay cả khi họ quyết định làm điều đó để “thể hiện tính minh bạch”, họ vẫn có thể chọn lọc thông tin hoặc biến quá trình truy cập thông tin trở nên khó khăn một cách nực cười.

Để bạn có thể hiểu rõ hơn về phạm vi của ngành công nghiệp thu thập dữ liệu, công ty Datalogix (đây cũng là công ty môi giới dữ liệu đầu tiên mà Facebook kí hợp đồng vào năm 2012) có thông tin về hầu hết mọi hộ gia đình tại Mỹ và nắm trong tay lượng thông tin giao dịch người dùng lên tới 1.000 tỷ USD. Acxiom, một công ty môi giới khác có liên kết với Facebook có thông tin về khoảng 500 triệu người tiêu dùng trên toàn thế giới, với khoảng 1.500 điểm dữ liệu cho mỗi người.

Những loại quảng cáo của Facebook do các bên thứ ba cung cấp thường là về tài chính, chẳng hạn như nguồn thu nhập hàng tháng, giá trị tài sản, hoặc bạn có đi đến những cửa hàng giá rẻ để mua đồ hay không.

Cách Facebook sử dụng dữ liệu của bạn

Dữ liệu Facebook thu thập được dùng để cung cấp cho các dịch vụ, chẳng hạn như đưa ra các nội dung đề xuất, giúp bạn tìm một sự kiện tại địa phương hoặc hiển thị tin tức phù hợp với sở thích của bạn.

Ngoài ra, thông tin cũng được chia sẻ với tất cả các nền tảng và ứng dụng mà Facebook sở hữu [bạn đọc có thể xem lại phần trên].

Cuối cùng, Facebook sử dụng dữ liệu của bạn để cung cấp cho các dịch vụ tiếp thị. Theo như chính sách sử dụng dữ liệu của Facebook: “Với điều này, chúng tôi sử dụng tất cả các thông tin chúng tôi có về bạn để hiển thị cho bạn những quảng cáo có liên quan”. Facebook không chia sẻ những thông tin mang tính nhận dạng cá nhân (những thông tin có thể dùng để xác định bạn như tên hay địa chỉ email). Tuy nhiên, nó chia sẻ tất cả các loại thông tin khác, bao gồm sở thích của bạn, lịch sử duyệt web, địa điểm, thông tin thanh toán, trạng thái mối quan hệ, thông tin gia đình,…

Sự nguy hiểm của việc tạo hồ sơ thông tin cá nhân

Việc sử dụng dữ liệu của bạn cho mục đích tiếp thị có thực sự là một vấn đề không? Xét cho cùng, Facebook không chia sẻ cái gọi là thông tin nhận dạng cá nhân. Rất ít doanh nghiệp có thể tồn tại đến ngày nay nếu như họ không thể nhắm đến đúng đối tượng người dùng. Bên cạnh đó, một số người tiêu dùng cho rằng việc các quảng cáo được chỉnh sửa sao cho phù hợp với nhu cầu của họ cũng khá tiện lợi.

Tất cả mọi thứ đều còn phụ thuộc vào quy mô. Peter Eckersley, một nhà khoa học máy tính tại Electronic Frontiers, nói rằng ngay cả khi các công ty sử dụng những phương pháp thu thập thông tin của Facebook, không có công ty nào có thể sử dụng toàn bộ chúng cùng một lúc.

Bên cạnh mối lo ngại hiển nhiên nhất là có quá nhiều thông tin được tập hợp tại một công ty (khi Facebook có 1,94 tỷ người dùng thường xuyên hàng tháng trong năm 2017), dữ liệu có thể bị lạm dụng bởi các nhà quảng cáo theo nhiều cách khác nhau. Ví dụ, chủ xe máy có thể nhìn thấy các quảng cáo bảo hiểm có giá cao hơn mặt bằng chung, hay những người có thu nhập thấp chỉ được giới thiệu mua nhà chất lượng thấp.

Bạn có thể “rút lui” hay không?

Câu trả lời ngắn gọn là không.

Câu trả lời “dài gọn” là nó còn phụ thuộc vào việc bạn muốn rút lui khỏi cái gì. Bạn có thể ngưng việc nhìn thấy những quảng cáo được chỉnh sửa dựa trên sở thích, nhưng điều đó không có nghĩa là Facebook sẽ ngừng theo dõi bạn.

Yêu cầu các công ty môi giới dữ liệu dừng việc thu thập dữ liệu của bạn, về lý thuyết là có thể, nhưng trên thực tế lại là một công việc gần như bất khả thi. Để thoát khỏi Datalogix, bạn sẽ phải gửi yêu cầu kèm theo bản sao của ID (giống như CMND của Việt Nam). Julia Angwin, tác giả của cuốn sách Dragnet Nation: A Quest for Privacy, Security, and Freedom in a World of Relentless Surveillance đã từng thử rút lui khỏi 92 công ty môi giới dữ liệu có tùy chọn cho phép rút lui. Kết quả là, trong phần lớn số lần thử, bà đều thất bại.

Có một số cách để giảm thiểu thiệt hại. Bạn có thể đổi tùy chọn quyền riêng tư để quyết định xem ai có thể xem các bài đăng và thông tin trang cá nhân của bạn trên Facebook.

Ngoài ra, bạn cũng có thể cài đặt Tor, một trình duyệt giúp bạn ẩn danh (phần nào) trên Internet.

Tuy nhiên, cách duy nhất để ngăn chặn việc thu thập thông tin của Facebook chính là xóa tài khoản của bạn. Như trong chính sách sử dụng dữ liệu có nói: “Chúng tôi lưu trữ dữ liệu lâu nhất có thể để cung cấp các sản phẩm và dịch vụ cho bạn và mọi người. Thông tin có liên quan đến tài khoản của bạn sẽ được giữ cho đến khi tài khoản của bạn bị xóa, trừ khi chúng tôi không còn cần đến những dữ liệu đó để cung cấp sản phẩm và dịch vụ nữa”.

Tất nhiên, từ bỏ Facebook không phải là chuyện đơn giản, khi nó đã trở thành một phần trong cuộc sống hiện đại của mỗi chúng ta. Điều bạn nên làm là cân nhắc thật kỹ, liệu những gì mà Facebook (và những nền tảng khác thuộc sở hữu của Facebook) đem lại có đáng với những gì chúng ta đã bỏ ra hay không?

 

Advertisements

Một câu truyện về thế giới Hacker


Hacker người Ukraine – vũ khí lợi hại nhưng cũng là ác mộng của FBI

Câu chuyện bên dưới do trang Wired kể lại về một hacker người Ukraine đã tự nộp mình cho Mỹ, làm việc với FBI để tóm một số tin tặc khác. Nhưng rồi chàng hacker này lại quay sang tấn công AT&T và một số trang khác hòng lấy được tiền chuộc để tránh tiết lộ các thông tin mật và mã nguồn phần mềm VMWare. Câu chuyện này khá ly kì, không khác gì phim hành động, tuy hơi dài nhưng rất hấp dẫn nên anh em chịu khó xem hết. Qua đó, chúng ta cũng thấy được sự giúp đỡ tận tình của một nhân viên FBI trong quá trình giúp người hacker này thoát khỏi án nặng cả trên đất Mỹ lẫn sau khi anh quay lại Ukraine.

Đến Mỹ

Tháng 1/2001, Maksym Igor Popov, một chàng trai trẻ 20 tuổi, bước đi một cách lo lắng bên ngoài cửa Đại sứ quán Mỹ tại London. Người ta cứ tưởng anh là một sinh viên chuẩn bị xin visa đi du học, nhưng thực chất anh là một hacker, là một thành viên của một băng đảng tin tặc Đông Âu đã đột nhập và tống tiền nhiều công ty ở Mỹ. Giờ đây anh đang chuẩn bị gặp một nhân viên FBI, người sẽ đưa cho anh passport và một tấm vé tới Mỹ, đổi lại anh sẽ phải làm việc cho FBI dưới danh nghĩa là một chuyên gia bảo mật.

Popov lo lắng như cũng rất hứng thú. Anh đã bỏ lại phía sau đất nước Ukraine, bỏ lại cha mẹ và tất cả những gì thân thuộc với mình. Anh cũng là một người đang bị truy nã trên toàn thế giới, giống như hình tượng của một hacker trong những quyển tiểu thuyết mà anh thích. Giờ anh sẽ làm mới lại mình bằng cách “bán” những kiến thức về bảo mật cho chính phủ Mỹ để lấy mức lương tạm được, sau đó sẽ chuyển sang làm một startup Internet nào đó rồi trở nên giàu có. Và giờ đây, anh cùng với người nhân viên FBI đó đang trên đường sang Mỹ.

Ukraine-Hacker-FBI

Khi máy bay đáp xuống, mọi thảo thuận với Popov đã thay đổi một chút. Người nhân viên FBI từng tỏ ra thân thiện giờ đang ném Popov vào một căn phòng cách ly, sau khoảng 1 giờ thì quay lại với một công tố viên liên bang kèm theo một “đề nghị”: Popov sẽ trở thành người liên lạc của FBI, làm việc cả ngày và lừa những người bạn tội phạm của anh vào lưới FBI. Nếu từ chối, anh sẽ đi thẳng vào tù.

Popov bị sốc. Anh được đưa về một căn nhà ở Fair Lakes, Virginia với sự canh giữ 24 tiếng liên tục bởi FBI. Anh được hướng dẫn là hãy nói chuyện với những người bạn của mình bằng tiếng Nga, trong lúc đó FBI sẽ thu lại tất cả. Nhưng Popov có mánh riêng của mình. Anh giả vờ như hợp tác trong khi vẫn sử dụng các thuật ngữ Nga để cảnh báo đồng bọn của mình rằng anh đã nằm trong tay chính phủ Mỹ. Khi sự việc bị phát hiện 3 tháng sau đó, FBI đã giận dữ lôi anh khỏi căn nhà an toàn của mình và đưa vào một nhà tù nhỏ để chuẩn bị đối mặt với các cáo trạng về việc tống tiền lúc trước. Miệng thì anh chửi thề nhưng anh thật sự lo sợ. Hàng loạt công tố viên đang xếp hàng chờ để đưa anh vào tù.

Ngay lúc đó, một nhân viên FBI khác ở Santa Ana, California, và một đặc vụ tên Ernest “E. J.” Hilbert lại tin rằng chính phủ Mỹ đang cần Popov hơn bao giờ hết.

Đánh vào Western Union đòi tiền chuộc

Hilbert nhận ra Mỹ đang ở một thời khắc quan trọng về chiến tranh mạng. Trong những năm 1990, hack chủ yếu là để cho vui. Nhưng tới năm 2000, các nước Đông Âu bắt đầu ngập tràn thư rác, thư lừa đảo, trang web bị hack, trộm thẻ tín dụng… Việc hack khi đó đã dính dáng tới những tổ chức vì lợi nhuận. Năm 2001, hacker tại Ukraine và Nga đã mở trang web CarderPlanet chuyên bán thông tin cá nhân đã trộm được cũng như thông tin thẻ trên đó. CarderPlanet cho thấy một hiểm họa nổi lên với nền công nghệ toàn cầu: các vụ hack sẽ có khả năng mở rộng, không phải bình thường mà là rất nhanh.

Quay trở lại với Popov, anh lớn lên tại một thị trấn ở Ukraine nằm cách thủ đô Kiev 2km về phía tây. Anh bắt đầu tiếp xúc với máy tính năm 15 tuổi, khi đó cha của anh mang về một chiếc PC và một cái modem để lên mạng. Nó là một chiếc Poisk-I, bản sao chép do Ukraine làm dựa trên mẫu IBM XT. Khi được xem bộ phim Hackers (1995), Popov biết rằng anh sẽ là một hacker nằm ngoài vòng pháp luật, và anh sẽ kiếm tiền từ việc đó.

Popov không thiên về kĩ thuật như những người bạn của mình, nhưng anh lại có tài quản lý, thuyết phục người khác và khả năng thiên bẩm về ngôn ngữ. Anh bắt đầu kiếm tiền bằng cách xài những thẻ tín dụng trộm được, kèm theo khả năng tiếng Anh cực kì lưu loát để gọi điện và mua những thứ anh muốn. Cũng trong thời gian đó, các nhóm gangstar bắt đầu biết về những cú lừa đảo trực tuyến của Popov và bắt đầu xuất hiện tại nhà của anh để bàn chuyện “làm ăn”. Popov quyết định sẽ thử kiếm tiền bằng cách mạnh tay hơn. Anh sẽ trộm dữ liệu khách hàng của các công ty, sau đó liên hệ với công ty và cung cấp dịch vụ “tư vấn bảo mật” để thông tin của vụ trộm không bị lộ ra ngoài, đổi lại công ty phải trả tiền cho Popov.

Tháng 7/2000, nhóm của Popov hack vào E-Money, một dịch vụ thanh toán ở Mỹ (nay đã giải thể) và trộm dữ liệu của 38.000 khách hàng. Họ cũng tấn công vào trang web của Western Union để lấy thêm 16.000 dòng dữ liệu về tên, địa chỉ, password và thông tin thẻ tín dụng. Popov tiếp cận những công ty này và đưa ra lời hứa hẹn sẽ ngừng tấn công, đồng thời im hơi lặng tiếng để đổi lại khoản tiền 50.000$ đến 500.000$.

Kết quả không như anh mong đợi. E-Money giả vờ thỏa thuận với anh trong khi vẫn liên lạc với FBI, Western Union thì thông báo rộng rãi về lỗ hổng này. Vậy nên Popov không thể lấy được tiền. Trong lúc đó, căng thẳng của anh với các tên gangster khác đang lên cao. Anh đang bị kẹt tại quê nhà của mình, giữa bộn bề những vụ lừa đảo và bạo lực. Anh nghĩ tới việc nộp mình cho Mỹ, để thoát khỏi Ukraine và “reboot” lại bản thân.

Giờ thì anh lại thấy mình đang ở trong một nhà tù gần văn phòng của Western Union, thật trớ trêu. Ít nhất là cho đến khi đặc vụ Hilbert tìm thấy anh.

Hilbert có kinh nghiệm giải quyết những tên hacker và các vụ án liên quan đến máy tính. Nói cách khác, Hilbert hiểu hacker nghĩ gì và muốn gì. Hilbert biết rằng với khả năng tiếng Nga và kinh nghiệm về bảo mật của Popov, anh ta có thể thâm nhập vào những nơi mà FBI không thể tới gần. Cụ thể, đó sẽ là những phòng chat ngầm, các bảng tin bị ẩn, các mối quan hệ, và đưa những thông tin quý giá đó cho FBI xử lý. Vấn đề ở đây là phải làm sao quản lý Popov thật kĩ lưỡng, đè lại cái tôi của anh ta và cho thấy FBI đang cần kĩ năng của anh.

Hilbert thảo luận kế hoạch của anh với một công tố viên ở Los Angeles, người đang thụ lý một vụ án của Popov, và sau đó hai người ngồi lại với Popov và luật sư của mình. Bốn người đồng ý với một bản thỏa thuận. Popov sẽ chỉ phải chịu một vụ án, những vụ còn lại sẽ được xóa nếu Popov dành thời gian làm gián điệp ngầm cho FBI. Lần này, anh phải đi nói chuyện với một nhóm người lạ, những người không hề tin tưởng Popov. Hilbert gọi đây là nhiệm vụ thu thập thông tin tình báo, giống như những gì James Bond làm. “Tôi thật sự rất xem trọng kĩ năng của anh” – Hilbert nói. Tháng 3/2002, Popov kí vào bản thỏa thuận và Hilbert có được một chú chuột chũi của mình.

Bắt đầu làm việc

Sau chuyến bay dài, Hilbert dẫn Popov vào một căn phòng trong ngày làm việc đầu tiên. Ở đây có một cái ghế, một cái bàn và rất nhiều máy tính Windows thu được từ những vụ đột nhập. Hilbert còng cùi chỏ của Popov vào bàn.

Họ gọi nhiệm vụ này là “Ant City”. Giờ Popov đã online trở lại, anh sử dụng một danh tính mới và bắt đầu thâm nhập vào các phòng chat ngầm cũng như đăng thông tin lên CarderPlanet. Anh đóng giả là một tên lừa đảo người Ukraine đang đi săn thông tin thẻ tín dụng bị đánh cắp. Mục tiêu của anh bây giờ là bắt được một trong những người đứng đầu của CarderPlanet, người được biết tới với nickname Script. Popov bắt đầu liên hệ vào đầu tháng 9, cả hai bắt đầu chat riêng qua phần mềm ICQ vốn được ưa chuộng ở Châu Âu. Hai tuần sau, Popov quyết định mua 400$ dữ liệu thẻ tín dụng. Khi gửi dữ liệu này cho Popov ở California, Script đã phạm một tội liên bang ở Mỹ. Bằng chứng của Hilbert sau đó giúp cảnh sát Ukraine bắt được Script, tuy nhiên 6 tháng sau hacker này đã được thả.

Việc thu thập bằng chứng như thế này là một thứ quan trọng và chiến lược với Hilbert. Bằng cách rải một ít tiền để Popov tạo dựng mối quan hệ, họ sẽ có được một số thông tin thẻ. Dựa vào đây, Hilbert có thể làm việc với các đơn vị phát hành để xác định nguồn gốc của thẻ và nguyên nhân rò rỉ.

Ukraine-Hacker-FBI-2

Một số ngày thì ngắn, một vài ngày thì dài đến 10 tiếng làm việc. Tuy nhiên, mặc cho Popov có thành công đến đâu thì tới cuối ngày, anh vẫn quay trở lại tù, còn Hilbert thì về nhà với gia đình. Nhưng vào ngày lễ tạ ơn, Hilbert đã chuẩn bị một món quà bất ngờ cho Popov. Hôm đó, khi Popov tới chỗ làm, anh thấy một cái projector đã được dựng sẵn và đang chĩa vào tường. Hilbert nhấn một vài phím trên laptop và bộ phim “The Fellowship of the Ring” bắt đầu được chiếu lên. Bữa trưa, Hilbert đem đầy đủ các món Tạ Ơn: gà tây, sốt cranberry, khoai lang, thậm chí có cả bánh bí đỏ. Popov cảm thấy cảm động vì Hilbert đã chọn dành thời gian của ngày lễ này với anh thay vì với gia đình.

Vụ án 200.000$

Khi thông tin về Ant City bắt đầu lan rộng, Hilbert nhận được yêu cầu giúp đỡ từ các văn phòng FBI khác để tìm hiểu về một số vụ hack đang diễn ra. Tháng 2 năm 2003, có một vụ lớn chưa từng có: một kẻ nào đó đã xâm nhập vào Data Processing International (DPI) – một đơn vị xử lý thanh toán, để trộm thông tin của 8 triệu thẻ. Popov bắt đầu hỏi về DPI và có một sinh viên 21 tuổi ở Nga với nickname là RES, biết về 3 hacker chịu trách nhiệm của vụ án này.

Popov nói anh muốn mua hết 8 triệu thẻ đó với 200.000$, tuy nhiên anh cần một mẫu thử nghiệm nhỏ trước. Mẫu nhỏ này sẽ giúp anh xác định xem thẻ có thật sự đến từ vụ rò rỉ của DPI hay không. RES không tin Popov có đủ tiền để chi trả vì từ trước đến giờ anh chỉ thực hiện các thương vụ nhỏ.

Hilbert nghĩ ra một giải pháp. Hilbert, Popov và một số nhân viên FBI khác đi tới một ngân hàng gần đó. Ngân hàng đã đồng ý giúp đỡ bằng cách lấy tiền từ trong két ra và để trên bàn. Hilbert tháo còng cho Popov và quay một video cảnh Popov đang cầm tiền. “Hãy nhìn vào đống tiền này đi. Chúng rất thật (chửi tục), không có gì giả cả (chửi tục). Tôi sẽ chuyển nó vào tài khoản của mình”.

Ukraine-Hacker-FBI-3

Đoạn video đã làm cho nhóm hacker Nga hài lòng. Việc xác định ra RES còn dễ dàng hơn. Popov nói với hacker này rằng số tiền của anh đến từ công việc ở một công ty thẻ tín dụng tên là HermesPlast. Popov gợi ý RES hãy nộp đơn xin việc làm vào đây, gửi cho hắn ta trang web công ty và chia sẻ email của “ông sếp”, “Anatoly Feldman”.

RES gửi cho Feldman hồ sơ vào cùng ngày hôm đó, kèm theo là chứng minh nhân dân Nga của hắn. Tất nhiên, HermesPlast là công ty giả của Hilbert và Popov. Giờ FBI(web.com) đã có tên thật của RES, ngày sinh và địa chỉ. Và thật ngạc nhiên khi mánh này có thể được dùng đi dùng lại. Có một sự thật mà Popov luôn biết chắc về những hacker Đông Âu: họ thật sự muốn có một công việc.

Lần này, FBI là mục tiêu

28 tháng sau khi đến Mỹ, Popov được trả tự do ở hạt Orange, California, cách Disneyland 8 dặm. Tuy nhiên, anh không có giấy tờ nhập cư rõ ràng nên khó xin việc. Hilbert sắp xếp để FBI thuê cho Popov một căn hộ và trả lương 1000$/tháng cho anh. Nhưng Popov không thể quen được với cuộc sống này. Với sự cho phép của tòa, Popov được phép về lại Ukraine với điều kiện anh sẽ quay trở lại Mỹ sau khi đã hoàn thành án phạt của mình. Hilbert chở anh ra sân bay và biết rằng sẽ không bao giờ gặp lại Popov nữa.

Chương trình Ant City cũng đóng cửa. Theo thống kê của Hilbert, chiến dịch đã tránh cho 400.000 tài khoản thẻ tín dụng không bị phát tán ra thị trường chợ đen, đồng thời cảnh báo cho 700 công ty rằng họ đang hoặc đã bị tấn công bởi các hacker. 10 nghi phạm đã bị kết án, trong đó có Script, nhưng không có tên nào được giao cho Mỹ.

Khi về lại Ukraine, Popov lập một công ty về bảo mật của riêng mình tên là Cybercrime Monitoring Systems, gọi tắt là Cycmos. Cycmos chuyên thâm nhập vào các chợ ngầm và thông báo cho các công ty đang trở thành mục tiêu. Hilbert đồng ý. Có vẻ như anh đang biến kĩ năng mình học được từ Ant City thành một doanh nghiệp hoàn toàn đúng pháp luật.

Đến giao thừa năm 2004, điện thoại của Hilbert reo lên. Là Popov gọi. “Anh biết không, tôi có tin mới đây”. Đã có một vụ tấn công lớn, lần này FBI chính là nạn nhân. Popov đang theo dõi một nhóm hacker sử dụng công nghệ tên là X.25, nó được dùng để vận hành các mạng ở thập niên 70 và 80. Tới năm 2004, X.25 đã rất cũ nhưng vẫn còn nhiều doanh nghiệp và đơn vị chính phủ kết nối vào.

Dựa vào lỗ hổng của X.25, nhóm hacker đã đánh vào được một data center (trung tâm dữ liệu) của AT&T ở New Jersey, đây là nơi đặt mail server của rất nhiều cơ quan chính phủ Mỹ. Một trong số đó có FBI, và nhóm người Nga này đã có quyền truy cập vào địa chỉ của mọi nhân viên FBI.

Hilbert nhanh chóng gọi cho sếp của mình và dẫn đầu một cuộc điều tra. Hilbert đồng ý trả cho Cycmos 10.000$ để mua bất kì tài liệu nào bị rò rỉ cũng như biết danh tính của các hacker. Popov đến và đưa ra 2 tài liệu, một trong số đó liên quan tới CarderPlanet và một tài liệu khác về bảo mật. Tất cả đều được đánh dấu là tài liệu mật và không được chuyển qua Internet. Một số trang còn ghi danh tính của hơn 100 hacker đang trong tầm ngắm, nhiều người được đánh dấu là “mục tiêu ưu tiên cao” hoặc “đang phối hợp với chính phủ”. Nhà Trắng cũng được cảnh báo, đưa vụ việc lên tầm cao hơn.

Sau đó, Popov đưa Hilbert vào một phòng chat ngầm và tìm thấy gã lãnh đạo người Nga của nhóm X.25. Rất nhanh chóng, Hilbert bắt đầu nói chuyện với Leonid “Eadle” Sokolov, một sinh viên kĩ thuật ở Saint Petersburg, Nga. Khi được hỏi, Sokolov thừa nhận mình là người đã đột nhập vào AT&T và trộm tài liệu. Vậy là Hilbert đã có được hắn. Đây là vụ án lớn nhất trong sự nghiệp của Hilbert.

Nhưng rồi có một vấn đề nhỏ. Vào ngày 10/2/2005, Hilbert được gọi vào một cuộc họp, ở đó có 5 giám sát viên và một người công tố đang giận dữ qua điện thoại. Hóa ra, cũng có nhiều doanh nghiệp khác bị ảnh hưởng từ vụ X.25, trong số đó có EMC và mã nguồn của phần mềm ảo hóa nổi tiếng VMWare đã bị khai thác. Nếu mã nguồn này lộ ra, hacker từ khắp mọi nơi có thể dò lỗ hổng của nó. Trong trường hợp xấu nhất, hacker có thể thoát ra khỏi máy ảo và đánh vào hạ tầng thật bên dưới.

Với danh nghĩa “Denis Pinhaus”, Popov đã tiếp cận EMC và cảnh báo về vấn đề này. Với mức giá đúng, Popov hứa sẽ không để mã nguồn lọt ra ngoài và cung cấp thông tin kĩ thuật cho EMC về lỗ hổng. Để đảm bảo, anh ta đưa ra liên hệ của E. J. Hilbert để làm tin. EMC khi đó xem lời chào hàng này như là một nỗ lực chống lại luật và đã báo cáo cho văn phòng luật sư. Vụ việc tới tay của Stephen Heymann, một công tố viên “cứng cựa”, người cũng đã thụ lý vụ án Aaron Swartz. Giờ đây, đặc vụ Hilbert đang bị điều tra bởi Bộ tư pháp.

Heymann muốn biết người tên Pinhaus này là ai, và muốn tên thật của hắn để dẫn độ từ Ukraine về Mỹ. Hilbert nói rằng Heymann có thể thoải mái lục tìm hồ sơ của FBI để tìm ra tên thật của Pinhaus, ông cũng có thể thoải mái soạn thảo các đơn kiện với cái tên Pinhaus, nhưng ông sẽ không lấy được thông tin đó từ Hilbert. Rõ ràng, Heymann không hài lòng. Trước đó ông đã từng bỏ tù một nhân viên FBI khác khi cố gắng bảo vệ một kẻ sát nhân để giữ cho hắn ta tiếp tục làm người liên lạc.

Một người giám sát yêu cầu Hilbert rời khỏi phòng. Anh đi tới máy tính của mình và nhắn tin cho Popov. “Anh phải dẹp vụ này ngay, được không? Điều này rất quan rọng. Mọi người đang theo dõi vụ này”.

Sau đó, Hilbert quay trở lại với vụ AT&T. Sokolov bị buộc tội và cảnh báo đã được gửi tới Interpol. Khi Sokolov rời nước Nga và đến nước nào có hiệp định dẫn độ với mình, hắn ta sẽ bị bắt ngay lập tức. Popov được trả tiền và được gửi một bức thư cảm ơn từ FBI để gắn lên website của mình. Tất cả mọi thứ nhanh chóng chìm vào quá khứ.

4 tháng sau, FBI yêu cầu Hilbert cắt mọi liên lạc với Popov và giao nộp 600 trang dữ liệu chat giữa hai người trong vòng 18 tháng qua. Hilbert cũng không còn công tác tại bộ phận tội phạm mạng nữa mà chuyển sang bộ phận chống khủng bố.

Hilbert dần dần nhận ra có gì đó không ổn. Đồng nghiệp ngừng nói chuyện với anh, khi anh nộp đơn vào vị trí giám sát ở Los Angeles thì bị đưa ra khỏi danh sách và được thông báo là không nộp đơn lại. Lúc này, Hilbert mới biết mình đang bị điều tra trong cả năm qua vì tội âm mưa lừa đảo chính phủ, tiết lộ thông tin mật cho bên ngoài (là khi anh nói cho Popov về vụ EMC).

Hilbert cảm thấy tuyệt vọng. FBI là công việc mơ ước của anh, nhưng vụ việc đã chấm dứt tất cả. Anh còn có 2 đứa con ở nhà và một đứa thứ 3 sắp ra đời. Anh dần dần tìm việc ở các công ty tư nhân và đến tháng 2/2007, anh chính thức nghỉ việc ở FBI.

Ukraine-Hacker-FBI-4

Mọi chuyện kết thúc…

Khi Popov gọi lại cho Hilbert, lúc đó anh đang làm ở vị trí tư vấn viên. Trong hơn 6 năm kể từ lần cuối họ nói chuyện, Hilbert mới nhận lại được cuộc gọi từ một người “quen”. Lần này, Popov không có thông tin rò rỉ hay bất kì thứ gì khác, anh chỉ nói lời cảm ơn. “Anh ấy gọi tên để cảm ơn về cách tôi đối xử với ảnh trong thời gian ở tù. Giờ anh ấy đã về nhà, thay đổi cuộc sống, lập gia đình. Anh ấy nợ tôi tất cả”.

Vụ điều tra lúc đó vẫn chưa kết thúc. Đã có lúc các nhà điều tra đến tận văn phòng anh để đặt câu hỏi. Năm 2009, Hilbert được tuyên miễn tội khi Bộ tư pháp hủy các cáo buộc.

Nhưng có một thông tin mà sau này người ta mới biết, đó là EMC đã âm thầm trả cho Popov 30.000$ để lấy thông tin về lỗ hổng, đồng thời hứa trả thêm 40.000$ nữa trong vòng 4 năm sau nếu mã nguồn không bị phát tán. Popov giữ đúng lời hứa, nhưng khi yêu cầu EMC trả số tiền còn lại thì EMC đã vờ như không có gì xảy ra.

Vậy là Popov quyết định trả thù. Popov tạo một danh tính online mới là “Hardcore Charlie” và ngày 23/4/2012, 520 dòng code đầu tiên của VMWare xuất hiện. Nhiều chức năng của nó vẫn còn xuất hiện trong các sản phẩm VMWare đến tận ngày nay. Lúc này, EMC mới đi thuê tất cả những chuyên gia bảo mật mà họ có thể tìm được để vá hết các lỗ hổng. 10 ngày sau đó, bản cập nhật đầu tiên được phát hành. Khi Popov đưa ra một số lượng code lớn hơn vào tháng 11/2012 thì tất cả lỗ hổng quan trọng đều đã được bít lại.

Popov cũng thừa nhận rằng anh chính là người đứng sau vụ X.25 cùng với Sokolov. Ban đầu, cả hai chỉ định đòi 150.000$ từ AT&T để giữ bí mật về vụ việc nhằm tránh ảnh hưởng tới các hợp đồng với chính phủ. Chỉ khi AT&T từ chối trả tiền thì Popov mới gọi cho FBI. Popov nói anh không cố ý để Hilbert dính vào vụ lừa này. Anh ấy vẫn nhớ về ngày lễ tạ ơn năm 2002, về con gà tây, về bộ phim. “Anh ấy là người bạn duy nhất mà tôi có. Tôi vẫn quý anh ấy, ngay cả khi giờ đây anh ấy không còn ở gần tôi nữa. Tôi vẫn là một hacker mũ đen, và tôi không bao giờ thay đổi. Nhưng ai quan tâm chứ? Tôi vẫn quý anh ấy.” – Popov nói về Hilbert.

 

Nguồn: Wired

https://www.topitworks.com/blogs/hacker-nguoi-ukraine-vu-khi-loi-hai-nhung-cung-la-ac-mong-cua-fbi/

10 kỹ năng công nghệ giúp bạn tăng lương gấp 10 lần


 

Đây quả là một thời điểm tuyệt vời để trở thành chuyên gia công nghệ, vì tìm được việc làm lương cao đã trở nên dễ dàng hơn. Nhưng nói đi thì phải nói lại, dev nhà ta cũng khó lòng đáp ứng được những kỹ năng cao cấp mà nhà tuyển dụng cần đến.

Trang web tìm việc Dice.com vừa công bố khảo sát lương năm 2016. Kết quả thu được từ hơn 16 nghìn chuyên gia IT vào cuối năm 2015 đã chỉ ra lương bổng trung bình với nhân sự có sở hữu kỹ năng đang “hot”.

Hiên nhiên, chỉ kỹ năng thôi vẫn chưa đủ có lương cao, ta cần kinh nghiệm nữa.

10. Puppet

Founder của Puppet Labs, CEO Luke Kanies.

Puppet là phần mềm IT automation từ Puppet Labs, một trong số ít những công ty trẻ nhảy vào xu hướng công nghệ lớn, mới lạ, mang tên “DevOps”. DevOps là chỉ khi developers tạo phần mềm (“dev”) và các team chịu trách nhiệm deploy phần mền đó (“ops”) sử dụng một số kỹ thuật nhất định để deploy công nghệ thật nhanh, ngay khi được released.

9. MapReduce

Doug Cutting, tạo ra Hadoop từ hồi còn làm ở Yahoo, hiện đang làm việc tại Cloudera.

MapReduce là framework lập trình được dùng để phân tích và đúc kết từ dữ liệu. Công cụ thường đi kèm với Hadoop, hệ thống lưu trữ dữ liệu trên các server chi phí thấp.

8. Pig

Pig là một kỹ năng “nóng bỏng” khác liên quan đến Hadoop. Đây là ngôn ngữ lập trình cho phép bạn rút thông tin từ Hadoop, tìm lời giải cho các thắc mắc, và sử dụng data hiệu quả hơn.

7. Chef

Chef CEO Barry Crist

Chef là phần mềm IT automation theo khuynh hướng DevOps đã được nhắc đến ở trên. Chef đang cạnh tranh với Puppet.

6. CloudStack

 

Điện toán đám mây vẫn còn giữ vững độ hot của mình, các hệ thống đám mây mọc lên như nấm, đấu đá nhau loạn xạ, và người dùng đang hưởng lợi nhiều nhất. Một số hệ thống thì miễn phí và nguồn mở, nhưng đa phần vẫn là những hệ thống với mục đích thương mại, kèm theo lợi nhuận chéo từ phần mềm và trang thiết bị chuyên dụng cho thuật toán đám mây.

5. OpenStack

 

Hệ điều hành điện toán đám mây nguồn mở và miễn phí. Nhiều nhà cung cấp đang hỗ trợ và bán nhiều phiên bản thương mại khác nhau của OpenStack, có thể kể đếm IBM, HP, Red Hat, Ubuntu,…

4. PaaS

Scott Guthrie, người chịu trách nhiệm giám sát Microsoft Azure và các công cụ lập trình khác.

PaaS là “platform as a service”, ám chỉ hệ thống đám mây cho phép lập trình viên xây dựng toàn bộ ứng dụng và host những ứng dụng này lên cloud. Azure của Microsoft là ví dụ rõ ràng nhất.

3. Cloudera

 

Cloudera CEO Tom Reilly.

Cloudera Cloudera là bản sao thương mại của Hadoop. Tuy Hadoop là miễn phí và nguồn mở, nhưng phiên bản Hadoop miễn phí lại rất khó sử dụng. Bởi vậy, nhiều công ty đã nhảy vào thương mại hóa môi trường này sao cho thật thân thiện để cạnh tranh với Hadoop, và Cloudera là một trong những project nổi tiếng nhất.

2. Cassandra

Cassandra là database “noSQL” miễn phí và nguồn mở, có thể xử lý và lưu trữ nhiều kiểu và kích thước dữ liệu khác nhau. Database này càng ngày càng quang trọng cho các ứng dụng mobile và cloud. Netflix, Apple và nhiều công ty khác hiện đang sử dụng Cassandra đễ lưu trữ dữ liệu của mình (khối dữ liệu của Apple lên đến 10 petabyte).

1. HANA

HANA là database của SAP, là một thành phần trong làn sóng database mới, có tên gọi in-memory database. Kiểu database này hoàn toàn chạy trong bộ nhớ của máy tính chứ không phải trên storage disk. Bới vậy, chúng hoàn toàn có thể xử lý lượng lớn dữ liệu gần như ngay lập tức.

 

Tham khao: https://techtalk.vn/10-ky-nang-cong-nghe-giup-ban-tang-luong-gap-10-lan.html

Techtalk via businessinsider

Sử dụng CDN để giảm tải cho Server


 

Câu chuyện bắt đầu

Gần đây, tôi có tham dự một lớp học Rails của các sinh viên năm thứ 4 ngành công nghệ thông tin. Trong buổi học đó, sinh viên tìm hiểu về thư viện Bootstrap của Twitter. Có 2 cách để import thư viện vào trong trang web, 1 là sử dụng 1 đường link ở “tận đẩu tận đâu” như thế này.

2 là lên trang chủ của Bootstrap, download về server của mình rồi import file từ chính server của mình

Khi tôi hỏi so sánh hai cách làm, cách nào hay hơn, thì hầu hết các sinh viên đều cho rằng cách thứ 2 hay hơn, lý do là vì nó: “Nhanh hơn?”, “Cùng server mình thì chỉ gửi request 1 lần là xong” @@

 Lý do thứ 2 chắc chắn sai, vì request đầu tiên sẽ nhận về file HTML, trình duyệt sẽ xử lý file đó và tìm các link để tiếp tục gửi request, trong trường hợp này thì tối thiểu là 2 request, trong đó request thứ hai để lấy về file CSS. Vậy còn lý dó thứ nhất “Nhanh hơn?”. Liệu có đúng? Có phải vì cùng server trả về file HTML nên mình cho rằng nó sẽ “nhanh”?

Câu trả lời trong hầu hết các trường hợp là “không”! (Chỉ hầu hết thôi nhé…  )

Lý do tại sao, chúng ta sẽ cùng tìm hiểu về cái link “tận đẩu tận đâu” kia! https://maxcdn.bootstrapcdn.com/bootstrap/3.3.5/css/bootstrap.min.css

Đó là CDN!

CDN là gì?

CDN viết tắt của Content Delivery Network, tạm dịch là “Mạng phân phối thông tin”. CDN là một hệ thống các server phân tán trên khắp thế giới, đưa nội dung đến với người dùng một cách nhanh nhất có thể dựa theo vị trí địa lý của người dùng và các servers lưu trữ thông tin.

CDN đóng vai trò quan trọng trong việc tăng tốc độ truyền tải dữ liệu đến với người dùng, đặc biệt với các website có ý định phát triển vươn ra toàn cầu. Ví dụ đơn giản là khi một người dùng tại Hà Nội muốn nhận một tập tin, nếu tập tin đó được chuyển đến từ Mỹ thì sẽ phải mất nửa vòng trái đất để đến đích. Rõ ràng con đường đó quá dài và sẽ tốn thời gian hơn rất nhiều nếu nó được gửi từ Singapore hay Nhật Bản.

 

Screen Shot 2016-09-28 at 10.14.18 AM

Hình trên là mô hình mạng của trang web cloudflare.com, một website cung cấp dịch vụ CDN. Có thể thấy có rất nhiều server phân tán trên khắp thế giới, và sẽ thật may mắn nếu bạn sống ở Hà Nội và nhận được tập tin từ một server tại Singapore, thay vì từ Chicago @@

CDN hoạt động như thế nào?

Nguyên tắc hoạt động

Nguyên tắc cơ bản của CDN là rải rác dữ liệu ở rất nhiều server trên thế giới (các file tĩnh như hình ảnh, video, Javascript, CSS,…). Server có khoảng cách địa lý đến người dùng gần nhất sẽ được dùng để gửi dữ liệu đến cho người dùng.

 

Screen Shot 2016-09-28 at 10.17.10 AM

Hình trên mô tả một mô hình đơn giản của CDN. Có một server chính (Original server) đóng vai trò trung gian nhận request, dữ liệu và phân phối request, dữ liệu đến các server cạnh (edge server). Người dùng ở gần server cạnh nào nhất sẽ nhận được dữ liệu trả về từ server đó. Từ “server” ở hình trên chỉ mang tính mô phỏng, bởi các điểm được chỉ định sẽ có một data center với hàng tá máy chủ hoạt động ngày đêm, với vai trò đảm bảo cho CDN luôn luôn hoạt động.

CDN ra đời cách đây khoảng 15 năm nhưng chỉ gần đây mới thực sự phát triển khi mà lượng người dùng và tài nguyên internet tăng không ngừng cũng như thiết kế đã có những bước đột phá nhất định. Một vài nhà cung cấp dịch vụ CDN quen thuộc với dân lập trình là BootstrapCDN của Twitter, Amazon CloudFront của Amazon, Windows Azure CDN của Microsoft,…

Câu hỏi được đặt ra là làm cách nào mà CDN có thể tìm ra được máy chủ gần người dùng nhất để cho phép tập tin gửi từ đó mà không phải từ máy chủ khác. Rõ ràng chúng ta chỉ có một đường link duy nhất, gửi một request từ browser, trong khi có vẻ có rất nhiều server ?

Chúng ta cùng tìm hiểu cách định tuyến (routing) trong CDN.

Request Routing

Theo phân tích của website WindowsITPro, CDN có ba cách định tuyến, đó là: DNS Request Routing (Định tuyến sử dụng DNS), Transport Layer Request Routing (Định tuyến ở tầng vận tải), và cuối cùng là Application-layer Request Routing (Định tuyến ở tầng ứng dụng). Cả 3 cách thức đều khá phức tạp và đòi hỏi kiến thức cao về network protocol. Thêm vào nữa đây chỉ là phân tích của các nhà nghiên cứu, không phải của bản thân nhà cung cấp dịch vụ CDN (theo tôi biết thì ông nào cũng quảng cáo thuật toán của mình bá nhất @@), do vậy tôi sẽ chỉ “thử” giải thích một kỹ thuật mà tôi thấy dễ hiểu nhất, đó là Transport Layer Request Routing.

 

Screen Shot 2016-09-28 at 10.27.14 AM

Hình trên là mô tả chung cho Transport Layer Request Routing. Để khớp với mô hình CDN ở trên, chúng ta tạm coi POP1 là Original Server, và POP2 là một Edge Server. Tại mỗi server đều có sẵn hệ thống định tuyến ở tầng vận tải (Transport Layer Routing System – TLRS). Con đường request của người dùng sẽ như sau.

  1. Sau khi nhận kết quả từ DNS Server, người dùng gửi request đến địa chỉ IP của POP1 (Original Server). Đây là một địa chỉ IP ảo (Virtual IP – VIP)
  2. TLRS ở tầng POP1 sẽ kiểm tra thông tin của người dùng, kiểm tra trong số các Edge Server của nó xem đâu là server thích hợp nhất để trả gói tin. Sau khi xác định được Edge Server thích hợp, POP1 sẽ chuyển tiếp (forward) request của người dùng đến Edge Server đó (POP2).
  3. Sau khi kiểm tra thông tin được gửi từ POP1, POP2 sẽ đổi địa chỉ IP nguồn của nó theo IP ảo của POP1, rồi gửi tập tin lại cho người dùng. Khi nhận được tập tin, người dùng (chính xác hơn là trình duyệt của người dùng) vẫn tin là nó nhận được từ POP1 mà tiếp tục gửi các request tiếp theo (nếu có).

Trên đây là một giải thích đơn giản cho cơ chế định tuyến của CDN. Bạn đọc có hứng thú có thể tự tìm hiểu thêm.

Vai trò của CDN trong việc giảm tải cho server

Trên đây bạn đọc đã có được khái niệm cơ bản về CDN. Chắc các bạn cũng đã hình dung được tương đối lợi ích mà nó mang lại, sau đây tôi xin được tổng hợp các lợi ích của CDN trong việc giảm tải cho server cũng như cải thiện trải nghiệm người dùng, đem đến một website có tốc độ load nhanh hơn.

  • Tăng tốc độ, tiết kiệm băng thông
    Như đề cập ở đầu bài viết, với mỗi một request đến các link có trong tập tin HTML đầu tiên, bao gồm các link CSS, Javascript, video, hình ảnh,… trình duyệt sẽ gửi một request lên địa chỉ đó. Trong trường hợp chúng ta sử dụng CDN, thay vì request lên server của chúng ta, trình duyệt sẽ gửi request lên một server khác. Qua đó giảm được lưu lượn truy cập đến server hiện tại. Và như có đề cập ở trên, server này sẽ được tối ưu để “gần” nhất với máy tính của chúng ta, qua đó tốc độ được đảm bảo luôn ở mức tốt nhất.
  • Tập tin có thể được được lưu tại cache của trình duyệt
    Ngày này, rất nhiều trang web sử dụng CDN. Ví dụ, jQuery hay Bootstrap. Nếu người dùng truy cập đến trang web có sử dụng thư viện jQuery của bạn, mà máy tính họ đã truy cập vào một trang web cũng sử dụng thư viện đó với nhà cung cấp CDN như bạn, trình duyệt của họ sẽ không cần gửi request đi đâu cả mà sẽ load lại từ cache ra. Qua đó, tốc độ được cải thiện một cách không ngờ.
  • Tăng số lượng tập tin được load tại một thời điểm
    Có một điều thú vị về các trình duyệt, đó là các trình duyệt sẽ giới hạn số lượng request đến một domain tại một thời điểm nhất định, con số này thường là 4. Vậy nếu bạn có request số 5 đến cùng một domain, trình duyệt sẽ đợi cho ít nhất 1 trong 4 request đang chạy được hoàn thành rồi mới đến request số 5. Do vậy, bằng việc phân tán request sang một server khác (CDN), bạn không những giảm số lượng request lên server mình, mà còn cho trình duyệt có cơ hội thực hiện request khác cùng thời điểm.
  • Các phiên bản đều được quản lý
    Quản lý phiên bản (version control) là chức năng có sẵn của các dịch vụ CDN. Với vai trò nhà phát triển web, bạn dễ dàng xác định tập tin nào với phiên bản nào cần gửi cho người dùng mà không lo mất mát hay bị lỗi.
  • Cơ sở hạ tầng cực kỳ tốt
    Tin hay không tùy bạn, dù bạn có thuê được một dịch vụ lưu trữ tốt đến mấy, tôi vẫn không chắc nó tốt hơn những gì mà người khổng lồ Google, Amazon, Microsoft mang lại. Do vậy, bạn có thể hoàn toàn tin tưởng rằng tập tin sẽ luôn được truyền đến đích khi sử dụng dịch vụ do các CDN hàng đầu cung cấp. Tham khảo các CDN phổ biến ở đây: http://www.cdnreviews.com/popular-cdns/
  • Phân tích người dùng (User Analytics) Một điều tuyệt vời nữa là các nhà cung cấp CDN còn bổ sung thêm chức năng phân tích lưu lượng người dùng. Thuê một dịch vụ CDN, đồng nghĩa với việc bạn có một dịch vụ phân tích người dùng, để biết ai, từ đâu, thời gian nào truy cập vào dịch vụ của bạn. Qua đó có những biện pháp thích hợp để cải thiện chức năng hệ thống

Một vài lưu ý về sử dụng CDN

Quay trở lại với câu hỏi câu chuyện ở đầu bài viết, khi tôi kết luận rằng, nếu đặt file CSS trên server của bạn thì THƯỜNG sẽ load chậm hơn là dùng file từ CDN. Tại sao lại là “thường” khi mà ở trên chúng ta đã liệt kê hàng loạt ích lợi của CDN? OK, tôi xin phép đưa ra một số lưu ý theo kinh nghiệm và hiểu biết cá nhân.

  • Không phải lúc nào CDN cũng nhanh hơn, nếu các tập tin đó chỉ được truy cập thông qua trang web của bạn (khả năng được cache sẽ thấp), hay khi bạn có một server đủ nhanh để tốc độ có thể nhanh hơn server của CDN. (Ví dụ nếu người dùng truy cập từ Việt Nam và server bạn đặt ở Việt Nam thì có thể sẽ nhanh hơn CDN, bởi theo tôi thấy thì CDN đặt server gần nhất là tại Singapore, không phải Việt Nam)
  • Không phải lúc nào CDN cũng là lựa chọn tốt, nếu bạn chỉ muốn hướng đối tượng người dùng đến một quốc gia nhất định. Hay nói cách khác là khi bạn không có ý định toàn cầu hóa trang web của mình, thì việc sử dụng CDN là thừa thãi và không cần thiết. Thử tưởng tượng bạn có một trang web cho người Việt Nam, mà lại đặt một video quảng cáo ở server tận Los Angeles thì…chả biết để làm gì @@ (nếu dịch vụ của bạn cũng hướng đến Việt kiều thì lại là hợp lý  )
  • Không phải công ty nào cũng đủ khả năng tự xây dựng một hệ thống CDN cho riêng mình, bởi nó quá phức tạp, đòi hỏi sự tham dự của nhiều bên liên quan ở nhiều quốc gia. Do vậy, việc sử dụng các dịch vụ cung cấp CDN có sẵn là lựa chọn thích hợp. Tuy nhiên, bạn nên có lựa chọn đúng đắn, ngoài giá cả thì các vấn đề về bảo mật cũng rất quan trọng. Nguy hiểm có thể rình rập khi tập tin Javascript của bạn bị chỉnh sửa, cài mã độc khi về đến phía người dùng, gây nguy hiểm cho cả người dùng và website của bạn. Do vậy, tôi khuyến cáo đã không dùng thì thôi, đã dùng thì nên chọn một nhà cung cấp đáng tin cậy.
  • Điều cuối cùng, khi bạn deploy server với các tập tin tĩnh (Javascript, CSS, Video, Ảnh,…) cần đẩy lên server của CDN, điều đó có nghĩa là công việc deploy của bạn thêm một mức phức tạp và một mức rủi ro, do vậy, cần đảm bảo cơ chế deploy của mình là tốt nhất có thể để tránh gây ra các lỗi không đáng có.

 

Tài liệu tham khảo

 

Techtalk via Viblo

https://techtalk.vn/su-dung-cdn-de-giam-tai-cho-server.html

 

How to install Nagios On CentOS 7


Improve GNU/Linux

How to install Nagios On CentOS 7

Step : 1 To install required softwares as follows:

# yum install -y httpd php gcc glibc glibc-common gd gd-devel unzip zip make net-snmp perl

Step :2 To Create Nagios User and Group

# useradd nagios
# groupadd monitor
# usermod -G monitor nagios
# usermod -G monitor apache

Step : 3 To Download nagios:

# wget https://sourceforge.net/projects/nagios/files/nagios-4.x/nagios-4.3.4/nagios-4.3.4.tar.gz
# tar -xvf nagios-plugins-2.2.1.tar.gz

# cd nagios-4.3.4/
# ./configure –with-nagios-group=nagios –with-command-group=monitor

# vi /usr/local/nagios/etc/objects/contacts.cfg

# template which is defined else where.
define contact{
contact_name nagiosadmin ; Short name of user
use generic-contact ; Inherit default values from generic-contact template (defined above)
alias Nagios Admin ; Full name of user
email admin@lqs.co.in ; *** CHANGE THIS TO YOUR EMAIL ADDRESS ****
}

Creating sample config files in sample-config/ …

*** Configuration summary for nagios 4.3.4 2017-08-24 ***:

General Options:
————————-
Nagios executable: nagios
Nagios user/group: nagios,nagios

View original post 810 more words

64 Online Resources to Learn to Code for Free


Get Our FREE Ultimate Guide to Coding for Beginners

 

 

 

 

General

1. Codecademy

Codecademy is where most people who are new to coding get their start. If you haven’t been to the site yet…where have you been!? The platform revolves around interactive learning; that is, you read a little, type your code right into the browser, and see results immediately.

Topics taught: HTML & CSS, JavaScript, PHP, Python, Ruby, Angularjs, The Command Line, and more

2. Codewars

Codewars offers a fun way to learn coding. With a martial-arts theme, the program is based on challenges called “kata.” Complete them to earn honor and progress to higher ranks.

Topics taught: CoffeeScript, JavaScript, Python, Ruby, Java, Clojure, and Haskell

3. Coursera

Large online course library, where classes are taught by real university professors. All courses are free of charge, but you have the option to pay for a “Coursera Verified Certificate” to prove course completion. These cost between $30 and $100 depending on the course. Coursera also now has specializations, which you do have to pay for.

Topics taught: Many (far beyond your basic coding/computer science)

4. edX

An open-source higher education program governed by MIT and Harvard. Offers 107 courses under the “computer science” category, teaching various coding languages.

Topics taught: Java, C#, Python, and many more

5. Free Code Camp

Teaches coding first through an established curriculum, then by giving you hands-on experience working on projects for nonprofits.

Topics taught: HTML, CSS, Bootstrap, JavaScript, Databases, DevTools, Node.js, React.js, and D3.js

6. GA Dash

General Assembly’s free online learning platform. Entirely project-based. You build a “project” with each walk-through.

They are one of the very few options that have a course on how to build a Tumblr theme from scratch.

Topics taught: HTML, CSS, JavaScript, and responsive design

7. Khan Academy

Tons of subjects (as their front page says, “You can learn anything”), including many on computer programming. A few courses are offered for younger kids, too.

Topics taught: Many

8. MIT OpenCourseware

Competition to get into MIT may be stiff, but accessing their course material has no minimum SAT score. They maintain an online library of every subject they teach, with no account required for access.

Topics taught: Many

9. The Odin Project

Made by the creators of Viking Code School—a premiere online coding bootcamp. The Odin Project is their free version. FYI: you can also work with others in in-person or online study groups.

Topics taught: HTML, CSS, JavaScript & jQuery, Ruby programming, Ruby on Rails

10. Udacity

Offers individual courses, as well as “nanodegrees” that train you for specific careers like front-end web developer or data analyst. Some course materials are free, but nanodegrees require a tuition fee.

Topics taught: Many

11. Udemy

Paid and free courses on a variety of subjects, including web development, programming, datascience, and more. Courses can be created by anyone, so make sure to read reviews. Coupons can also be easily found, too. Check out some of their top development courses here.

Topics taught: Many

12. The Code Player

A compilation of video tutorials to help you walk through a process from start to finish. Good for learning “smaller” projects or tasks one at a time.

Topics taught: HTML5, CSS3, Javascript, Regex, JQuery

YouTube Channels

13. Coder’s Guide

Features numerous series of videos on coding topics: a 19-video series on JavaScript, another 19 videos on HTML/CSS, and more.

Topics taught: HTML, CSS, JavaScript, Bootstrap, WordPress, iOS and Android, and more

Subscribers: 44,215

14. DevTips

One of Travis Neilson’s YouTube channels. Focuses on web design and web development, with occasional live Q&As.

Topics taught: HTML, CSS, responsive design, development advice

Subscribers: 82,907

15. LearnCode.academy

My personal favorite. Web-development-focused videos made by Will Stern.

Topics taught: Sublime Text, Responsive Design, Node.js, Angular.js, Backbone.js, deployment strategies, and more

Subscribers: 154,590

16. thenewboston

Over 4,000 videos on a range of programming languages, game development, and design. Has over one million subscribers.

Topics taught: Android development, C programming, MySQL, Python, and more.

Subscribers: 1,131,977

For a more comprehensive list of 33 YouTube channels where you can learn to code, look here.

Blogs

17. A List Apart

Lots of authors. They write books, have events, and run a great development and design blog. See all code topics here.

18. CSS-Tricks

Goes deep into CSS with their big, bad CSS almanac. However, the blog now goes beyond just CSS and talks about other things like Sass, JavaScript, PHP, and more. Explore tons of resources and check out their code snippets.

19. David Walsh

Run by David Walsh (a senior developer at Mozilla), although there are others who write on the site too. Tutorials, how-tos, demos, and more.

20. Scotch.io

Covers lots of topics related to web development and workflow. To name a few: Angular, Node.js, Laravel, Sublime Text, and more.

21. SitePoint

They have lots of writers and publish often. Topics range from HTML and CSS to entrepreneurship. SitePoint now also has paid books and courses on their child site Learnable.

22. Tuts+

Tons of free tutorials, as well as paid options like actual courses. Has over 570 expertly-instructed video courses (on all topics, not just computer-related). Also publishes eBooks.

The Command Line

23. Command Line Power User

Free video series created by Wes Bos. More at an intermediate level, so not for total newbies.

24. Conquering the Command Line

Free online book by Mark Bates. Very in-depth. Can purchase hard copy and screencasts.

25. Learn Command Line the Hard Way

Free online book by Zed Shaw. (My personal favorite command line resource.)

Git and GitHub

26. Try Git

An interactive series of challenges to learn about and experiment with Git. Created by Code School.

27. Git Immersion

A guided tour to teach you the basics of Git. Set preferences and create your own projects.

HTML and CSS

28. Skillcrush’s Coding Bootcamp

Skillcrush’s free coding bootcamp is a perfect place to start for absolute newbies. You’ll learn what it means to work in tech, get digestible definitions of common industry lingo, and get the chance to write your first lines of code.

29. Learn CSS Layout

This website will teach you CSS fundamentals that are used in setting up a website’s layout. It’s best for those who already have basic HTML and CSS know-how.

30. Marksheet.io

For beginners. Broken down into four chapters: The web, HTML5, CSS3, and Sass. It’s like an online ebook, but under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. So you can adapt it for your needs.

31. Mozilla Developer Network

Free documentation on HTML and CSS (also JavaScript). Has tutorials for people of different levels, introductory to advanced.

32. HTML5 Dog

HTML beginner tutorial here. (They also offer intermediate and advanced HTML tutorials.) And ones on CSS.

JavaScript

33. Eloquent Javascript

Another online book, longer than most. It has big-tech financial backers like Mozilla and Hack Reactor (“the Harvard of coding bootcamps”).

34. Javascript.com

Created by Code School. Quick and perfect for absolute beginners. (Warning: JS in real life is a lot tougher.) 9 mini-lessons. At the end, it points you to more in-depth JS learning materials.

35. JavaScript for Cats

It’s like a single-webpage book broken down into sections. Created by programmer Max Ogden. Filled with non-cat gifs but has cat pics at the end. Just because. Lol.

36. Learn JS

Go through lessons, type in the window at the bottom. Created by the same folks who make learnpython.org.

37. NodeSchool

Has in-person workshops and events all over the world, as well as an active web presence. See online tutorials here.

38. That JS Dude

A website that teaches JavaScript. Specifically this, scope, hoisting, closures, inheritance, and more. It relies on videos as well as text to explain concepts. Created by @mdkhan005.

39. The Node Beginner Book

Written by Manuel Kiessling, this book targets people who have some experience in other programming languages. While the free version online is a shortened version of the full book, it still teaches a lot about Node.

WordPress

40. WordPress.tv

Recordings of live WordCamp lectures around the world. Created by Automattic.

41. WPBeginner

Website for beginner WP users. Great WP glossary of terms, plus coupon deals, video tutorials, and a blog which publishes useful articles by different authors.

Python

42. A Byte of Python

Free online book for beginners. Can choose to download it as a PDF for free or invest in the hard copy.

43. LearnPython.org

Interactive online tutorial to learn Python coding. Has a little window at the bottom where you can write your code as you go through the lessons.

44. Learn Python The Hard Way (Website)

The book costs money, but the website is free. Written by Zed Shaw. (I used the book when I first started learning.)

45. Python Spot

Beginner and intermediate Python tutorials. Most come in a written form. There’s also some tutorials on game development, databases, and more. All using Python, of course.

Ruby

46. Learn Ruby the Hard Way

Free HTML version of the book online. Buying the hard copy also gets you access to videos. Another book written by Zed Shaw.

47. Rails For Zombies

An interactive way to learn Ruby on Rails right in your browser. (This is a better choice for people who know some Ruby already.) Created by Code School.

48. Rails Tutorial

12-chapter book by Michael Hartl. Can purchase ebooks, screencasts from author, and more. Or just read it for free online.

49. RubyMonk

Entirely free, though you have the option to donate. Based on interactive tutorials, where you read a lesson and type in code. Lastly, “run” it. RubyMonk has one beginner course option, two intermediate, and one advanced.

50. Try Ruby

Also created by Code School, this is a better option for beginners. Type into an in-browser prompt window as you go through the exercises.

Databases

51. Learn SQL the Hard Way

Another resource created by Zed Shaw. This free online book takes you through 33 exercises. By the end, you should understand SQL, how to design data, and know a bit about database optimization. You don’t need to know how to program to work through the book, but it helps.

52. MongoDB University

Courses on MongoDB. Lessons come in video form. There are also quizzes and graded exercises along the way. Courses last seven weeks, but you can work through at your own pace. As of now, 200,000+ people have already taken courses on MongoDB University.

53. MySQLtutorial.org

Offers a range of MySQL tutorials including how to use MySQL as a developer and database administrator. They offer over ten different MySQL tutorials in total.

54. SQL for Web Nerds

Free digital book created by renowned computer science professor at MIT, Philip Greenspun. It contains 16 sections including data modeling, simple queries, transactions, trees, and more.

55. Vertabelo

This free platform has three different SQL courses: SQL Queries, Operating on Data in SQL, and Creating Tables in SQL. On Vertabelo you’ll learn in an interactive code editor, table, and console.

Design/User Experience

56. HackDesign

HackDesign is, “an easy to follow design course for people who do amazing things.” There are 50 lessons total, all taught by different instructors. Topics include typography, interaction design, front-end design, and more. You can get a design lesson delivered to your inbox once a week or you can view all the lessons on their site.

57. UX Apprentice

Created by Theresa Neil and the team at Balsamiq. This is like a UX 101 course — perfect for beginners. Three main parts: discovery, strategy, and design. As you go through, you are quizzed and shown related resources.

58. UXPin

While UXPin has paid offerings, there are a variety of free UX books available on the site. All you need to do is provide your email to access the material. They have books on minimalism, color theory, flat design, interaction design, and more.

Online Communities

59. CodeBuddies

Learn with others in peer-to-peer organized Google Hangouts. Great for those who want to study with others or do pair programming. CodeBuddies also has a Slack chatroom as well as Facebook group where people can congregate and ask questions.

60. CodeNewbie

CodeNewbie has a variety of tools for beginners including a Slack community where you can ask questions, a Twitter chat every Wednesday, a weekly podcast, and more. Now there are also some in-person meetups – like in Atlanta.

61. Newbie Coder Warehouse

Full disclosure: Newbie Coder Warehouse is my Facebook group of 2,200+ self-taught coders (and counting!). It’s a great place to ask questions as well as connect with others. And it’s super simple to join: all you need is a Facebook profile!

In-Person Workshops

62. codebar

codebar’s goal is enable underrepresented groups to learn how to code. They do this by offering free weekly workshops and events. Keep in mind codebar is based in the UK.

63. Girl Develop It

Girl Develop It (GDI) has chapters across the US and Canada. While most of GDI’s in-person workshops cost money, all of their course materials are readily available online for free. GDI also has free events, like their Code & Coffee meetup.

64. Women Who Code

Women Who Code is a non-profit with networks around the world. They have different events and workshops, all relating to code.

What’s next?

Relying on free courses and books is great when you’re just starting out. However, they can only get you so far.

Once you have the basics down, you’ll want to explore other options – like the Skillcrush Blueprints. If you’re brand new to the Skillcrush blog (welcome!) make sure to check out the free 10-day coding bootcamp. It’s the perfect way to test the waters, and see what Skillcrush is all about!

 

Author: LAURENCE BRADFORD
Laurence is a self-taught freelance web developer, focusing primarily on front-end technologies. In her spare time she manages learntocodewith.me, a blog geared to beginners teaching themselves how to code. Laurence is addicted to side projects and travel.

 

Refer: https://skillcrush.com/2016/03/15/64-online-resources-to-learn-to-code-for-free/

 

The Fourth Industrial Revolution – Cách Mạng Công Nghiệp Lần 4


Ebook tiếng việt : The Fourth Industrial Revolution – Cách Mạng Công Nghiệp Lần 4

The Fourth Industrial Revolution-Cuoc cach mang cong nghiep lan 4

https://nguoidentubinhduong.files.wordpress.com/2017/07/the-fourth-industrial-revolution-cuoc-cach-mang-cong-nghiep-lan-4.pdf

 

Cuộc Cách mạng Công nghiệp Lần thứ tư

Klaus Schwab

Người dịch:

Đồng Bích Ngọc

Trần Thị Mỹ Anh

MỤC LỤC

Lời mở đầu 1
1. Cuộc Cách mạng Công nghiệp Lần thứ tư 4
1.1. Bối cảnh lịch sử 4
1.2. Thay đổi sâu sắc và hệ thống 6
2. Các Nhân tố Thúc đẩy 10
2.1. Các xu thế lớn 10
2.1.1. Vật lý 10
2.1.2. Kỹ thuật số 12
2.1.3. Sinh học 14
2.2. Điểm bùng phát 18
3. Tác động 20
3.1. Kinh tế 20
3.1.1. Tăng trưởng 20
3.1.2. Việc làm 24
3.1.3. Bản chất của việc làm 33
3.2. Doanh nghiệp 36
3.2.1 Kỳ vọng của khách hàng 38
3.2.2 Những sản phẩm được nâng cao chất lượngnhờ dữ liệu 40
3.2.3 Đổi mới trong hợp tác 41
3.2.4 Các mô hình điều hành mới 41
3.3 Quốc gia và toàn cầu 48
3.3.1 Các chính phủ 49
3.3.2 Các quốc gia, khu vực và thành phố 53
3.3.3 An ninh Quốc tế 58
3.4 Xã hội 67
3.4.1 Bất bình đẳng và tầng lớp trung lưu 67

 

3.4.2 Cộng đồng 69
3.5. Cá nhân 72
3.5.1. Bản sắc, Đạo lý và Đạo đức 73
3.5.2. Kết nối con người 75
3.5.3. Quản lý Thông tin Công cộng và Cá nhân 76
Con đường Phía trước 79
Lời cảm ơn 86

 

Phụ lục: Biến đổi Sâu sắc 88
1. Công Nghệ Cấy Ghép trên Cơ thể Người 89
2. Hiện diệnSố 91
3. Ánh mắt Trở thành Phương tiện Giao tiếp mới 92
4. Thiết bị đeo trên người kết nối Internet 95
5. Mô hình Điện toán Phân tán rộng khắp 97
6. Siêu Máy tính Bỏ túi 99
7. Lưu trữ cho Tất cả 103
8. Mạng lưới Vạn vật Kết nối Internet 105
9. Ngôi nhà Kết nối 109
10. Các Thành phố Thông minh 111
11. Dữ liệu Lớn cho Những Quyết định 113
12. Những Chiếc Xe Không Người lái 114
13. Trí tuệ Nhân tạo và Trình Ra Quyết định 117
14. Trí Thông minh Nhân tạo AI và các Công việc Bàn giấy 119
15. Người máy và Dịch vụ 122
16. Bitcoin và Đầu mối phân phối Blockchain 124
17. Nền Kinh tế Chia sẻ 125
18. Chính phủ và Đầu mối phân phối (Blockchain) 128
19. In và Sản xuất sử dụng công nghệ 3D 129
20. Công nghệ In 3D và Sức khỏe con người 132
21. Công nghệ in 3D và Các Sản phẩm Tiêu dùng 134
22. Con người được Thiết kế [103] 136
23. Công nghệ thần kinh Neurotechnologies [104] 138
Notes   141