Oracle Voting disk và Oracle OCR trong môi trường RAC

Trong Oracle, Voting Disk là một thành phần quan trọng của Oracle Clusterware, một phần mềm cung cấp tính năng tự động phân phối tải (load balancing) và đảm bảo khả năng chịu lỗi (high availability) cho các cụm dữ liệu (clusters).

Voting Disk In Oracle Rac Database | Oracledbwr

Voting Disk chứa thông tin về trạng thái của các node trong cụm dữ liệu (cluster). Mỗi node trong cụm dữ liệu đọc và cập nhật thông tin này khi chạy. Khi một sự cố xảy ra và một node không thể giao tiếp với các node khác trong cụm, Voting Disk được sử dụng để quyết định liệu node đó có còn sống hay không. Nếu một số lượng đủ các node vẫn có thể giao tiếp với nhau thông qua Voting Disk, thì cụm dữ liệu vẫn tiếp tục hoạt động; nếu không, cụm dữ liệu sẽ ngừng hoạt động.

Voting Disk thường được lưu trữ trên một ổ đĩa chia sẻ, để các node trong cụm dữ liệu có thể truy cập nó từ xa. Điều này đảm bảo rằng nếu một node gặp sự cố, các node khác vẫn có thể truy cập Voting Disk để đưa ra quyết định về trạng thái của cụm dữ liệu.

Network heartbeat là một cơ chế trong các hệ thống phân tán (distributed systems) để kiểm tra sự sống còn (liveness) và khả dụng (availability) của các thành phần trong hệ thống. Trong một mạng phân tán, các thành phần như các node trong một cluster hoặc các thiết bị mạng cần liên tục kiểm tra xem các thành phần khác có hoạt động hay không để đảm bảo rằng hệ thống vẫn hoạt động đúng cách.

Network heartbeat thường hoạt động như là một loạt các tin nhắn hoặc gói tin được gửi giữa các thành phần trong hệ thống. Các thành phần này thường là các node hoặc máy chủ trong cụm, và họ liên tục gửi các tin nhắn “heartbeat” cho nhau qua mạng. Khi một thành phần nhận được một heartbeat từ một thành phần khác, nó biết rằng thành phần kia vẫn hoạt động và khả dụng.

Nếu một thành phần không nhận được heartbeat từ các thành phần khác trong một khoảng thời gian nhất định, nó có thể kết luận rằng có sự cố xảy ra với các thành phần khác hoặc rằng kết nối mạng giữa chúng đã bị mất. Trong trường hợp này, thành phần có thể thực hiện các biện pháp như khôi phục lại kết nối hoặc thực hiện các hành động để đảm bảo tính nhất quán và khả dụng của hệ thống.

Disk heartbeat là một cơ chế được sử dụng để theo dõi trạng thái của voting disk trong một cluster. Nó hoạt động bằng cách ghi các message định kỳ vào voting disk. Nếu một instance không thể ghi message heartbeat vào voting disk trong một khoảng thời gian nhất định, nó sẽ cho rằng voting disk đã bị lỗi hoặc không còn hoạt động.

Disk heartbeat có những lợi ích sau:

  • Phát hiện lỗi: Giúp phát hiện lỗi voting disk.
  • Khôi phục lỗi: Giúp khôi phục lỗi voting disk bằng cách tự động rebalance cluster.

Disk heartbeat được thực hiện bởi Clusterware. Clusterware sử dụng một loại message heartbeat duy nhất cho disk heartbeat:

  • Voting disk heartbeat: Loại này được sử dụng để theo dõi trạng thái của voting disk.

Tần suất heartbeat và kích thước gói tin heartbeat cho disk heartbeat được cấu hình trong file cluster.ora.

Dưới đây là một số ví dụ về cách disk heartbeat được sử dụng trong Oracle Database:

  • Giả sử voting disk bị lỗi. Disk heartbeat sẽ phát hiện lỗi này và tự động rebalance cluster.

Disk heartbeat là một cơ chế quan trọng để đảm bảo tính ổn định và hiệu suất của Oracle Database cluster.

Sao lưu voting disk:

# liệt kê các VotingDisk hiện có, location…

cd /u01/app/19c/grid/bin

./crsctl query css votedisk

# Sao lưu voting disk

dd if=<đường_dẫn_của_voting_disk> of=<đường_dẫn_và_tên_tập_tin_sao_lưu>

#Check thông tin:

cd /u01/app/19c/grid/bin

./crsctl stat res -t

./crsctl query css votedisk

OLR:

./ocrconfig -local

./ocrcheck -local

./ocrdump -local

OCR:

./ocrconfig -local

./ocrcheck -local

./ocrdump -local

Voting Disk:

./crsctl query css votedisk

./crsctl replace votedisk +DATA

./crsctl delete css votedisk +FUID

./crsctl add css votedisk +RECO

Trong Oracle Database, OCR có nghĩa là “Oracle Cluster Registry”. Đây là một phần của Oracle Grid Infrastructure (OGI), một tập hợp các công cụ và dịch vụ cho phép quản lý các hệ thống cụm dữ liệu (clustered systems) bằng cách cung cấp khả năng chịu lỗi và khả năng mở rộng.

OCR chứa các thông tin quản lý cụm dữ liệu như danh sách các node trong cụm, danh sách các tài nguyên được quản lý (như các instance của Oracle Database, các service, các diskgroup,…), và các thông tin quản lý khác. Nó là một phần quan trọng của Oracle Clusterware, một phần mềm cung cấp khả năng chịu lỗi và khả năng mở rộng cho hệ thống Oracle Database.

OCR cung cấp các dịch vụ như phân phối tải tự động (automatic load balancing), cơ chế phục hồi lỗi (fault recovery), quản lý tài nguyên (resource management), và cân bằng tải (load balancing). Nó đảm bảo rằng các tài nguyên trong cụm dữ liệu được quản lý một cách hiệu quả và đồng nhất, và hệ thống có khả năng chịu lỗi để đảm bảo tính khả dụng của dịch vụ.

OLR (Oracle Local Registry) là một phần của Oracle Grid Infrastructure (OGI), nhưng khác với OCR (Oracle Cluster Registry), OLR chỉ tồn tại trên mỗi node của cụm dữ liệu (cluster) thay vì trên toàn bộ cụm. OLR chứa các thông tin cục bộ và cấu hình cho node cụ thể đó, trong khi OCR chứa thông tin quản lý cụm dữ liệu cho toàn bộ cụm.

Một số điểm quan trọng về OLR:

  • Thông tin cục bộ: OLR lưu trữ các thông tin cục bộ và cấu hình cho mỗi node trong cụm dữ liệu. Các thông tin này bao gồm cấu hình mạng, thông tin về các tài nguyên cục bộ như diskgroup và các thông tin quản lý khác.
  • Khả năng chịu lỗi và đồng bộ: Tương tự như OCR, OLR cũng được sao lưu và phục hồi tự động để đảm bảo tính nhất quán và khả dụng của hệ thống. Việc sao lưu OLR giúp đảm bảo rằng cấu hình cục bộ của mỗi node có thể được khôi phục trong trường hợp cần thiết.
  • Quản lý node cụ thể: OLR quản lý các thông tin và tài nguyên cục bộ cho mỗi node, bao gồm cả quản lý tài nguyên riêng biệt của node và cấu hình mạng cục bộ.
  • Công cụ quản lý: Oracle cung cấp các công cụ quản lý như olrconfig để thực hiện các tác vụ liên quan đến OLR như sao lưu, khôi phục và cấu hình.
0 0 đánh giá
Đánh giá bài viết
Theo dõi
Thông báo của
guest

0 Góp ý
Phản hồi nội tuyến
Xem tất cả bình luận