Alter Big Table thế nào để không bị treo hệ thống Oracle database
Giả sử chúng ta thực hiện thêm cột mới vào bảng có chứa 200-500 triệu dòng dữ liệu và cập nhật giá trị cho cột này trong Oracle Database có thể ảnh hưởng đến hiệu năng của hệ thống nếu không được thực hiện cẩn thận. Dưới đây là các bước để thực hiện nhiệm vụ này một cách tối ưu nhất có thể:
- data_big_copy: bảng dữ liệu
- data_note: cột mới thêm vào
- Không có index
0. Tạm thời tắt index và constraints (tuỳ chọn nếu có):
ALTER INDEX idx_data_big_copy UNUSABLE; ALTER TABLE data_big_copy DISABLE CONSTRAINT your_constraint_name;
1. Thêm cột mới vào bảng
Đầu tiên, bạn cần thêm cột mới data_note vào bảng data_big_copy. Việc thêm cột thường không tốn nhiều thời gian:
ALTER TABLE data_big_copy ADD data_note VARCHAR2(255);
thực hiện lệnh trên thì trong nháy mắt là xong vì bản chất chưa thay đổi gì đến dữ liệu.
2. Cập nhật giá trị cho cột mới
Cập nhật giá trị cho tất cả các dòng trong bảng có thể gây tải nặng lên hệ thống, do đó bạn nên chia quá trình này thành các batch nhỏ. Bạn có thể sử dụng PL/SQL để thực hiện việc này. Ví dụ sau đây cập nhật 1000 dòng một lần:
Sử dụng PL/SQL với batch processing
DECLARE CURSOR c IS SELECT rowid FROM data_big_copy WHERE data_note IS NULL; TYPE t_rowid IS TABLE OF rowid INDEX BY PLS_INTEGER; l_rowids t_rowid; l_limit PLS_INTEGER := 1000; -- Số dòng cập nhật mỗi lần BEGIN OPEN c; LOOP FETCH c BULK COLLECT INTO l_rowids LIMIT l_limit; EXIT WHEN l_rowids.COUNT = 0; FORALL i IN l_rowids.FIRST .. l_rowids.LAST UPDATE data_big_copy SET data_note = 'this is data notes by datalinks.vn DuoDBA' WHERE rowid = l_rowids(i); COMMIT; END LOOP; CLOSE c; END; /
=>> Thực hiện 1000 row mỗi lần cho đến hết, Cứ túc tắc mà làm không vội được đâu.
Vậy là sau hơn 2h chạy liên tục thì đã xong 200 triệu rows, server vẫn hoạt động bình thường =>> tính ra trung bình tầm 1 phút chạy được 1.5 triệu rows. (CPU 2 cores).
Nếu table của bạn có 1 tỷ rows thì cũng làm như các bước bên trên mà thôi, cứ túc tắc mà làm.
Kích hoạt lại index và constraints (tuỳ chọn nếu có):
ALTER INDEX idx_data_big_copy REBUILD; ALTER TABLE data_big_copy ENABLE CONSTRAINT your_constraint_name;
Kiểm tra hiệu năng: Theo dõi hiệu năng của cơ sở dữ liệu trong quá trình cập nhật để kịp thời dừng lại nếu phát hiện vấn đề.
Chú ý: Các bạn nên hạn chế thao tác khác trong lúc thực hiện job trên để CPU tập trung toàn lực thực hiện job đó, đây có thể coi là BIG JOB rồi nên có lúc cpu có thể full 100% CPU đó.