Statistik tabel

Bigtable menyediakan statistik tabel — metadata tentang tabel — yang memberikan informasi ringkasan tentang tabel tersebut, seperti jumlah baris atau jumlah rata-rata sel per kolom.

Dokumen ini menjelaskan statistik tabel dan menjelaskan cara mendapatkannya menggunakan Google Cloud CLI. Sebelum membaca halaman ini, Anda harus memahami model penyimpanan Bigtable dan sudah memahami praktik terbaik desain skema dan pembersihan sampah memori.

Statistik tabel memberikan kemampuan observasi ke tabel Bigtable. Eksperimen dapat berguna saat Anda memecahkan masalah terkait performa atau penyimpanan, atau saat Anda ingin menentukan sumber biaya penyimpanan. Mereka juga dapat membantu menentukan apakah Anda menyimpan lebih banyak data daripada yang dibutuhkan.

Presisi yang diharapkan

Saat mengambil statistik tabel untuk sebuah tabel, data yang Anda dapatkan merupakan perkiraan – statistik tabel mencerminkan status tabel dalam salah satu cluster instance Anda sejak pemadatan terbaru.

Kumpulan lengkap statistik tabel tidak tersedia hingga setelah pemformatan awal, yang biasanya terjadi sekitar seminggu setelah tabel dibuat. Statistik tabel akurat sejak pemadatan terbaru, yang mungkin maksimal seminggu yang lalu.

Kolom statistik tabel

Permintaan untuk statistik tabel tabel akan menampilkan kolom berikut. Detail dan contohnya ada di bagian berikutnya.

Kolom statistik tabel Nama API Deskripsi
Jumlah baris row_count Jumlah baris dalam tabel. Untuk detailnya, lihat Jumlah baris.
Jumlah rata-rata kolom per baris average_columns_per_row Jumlah rata-rata kolom di setiap baris untuk keseluruhan tabel. Untuk mengetahui detail dan contohnya, lihat Jumlah rata-rata kolom per baris
Jumlah rata-rata sel per kolom average_cells_per_column Jumlah rata-rata sel yang disimpan di semua kolom dalam semua baris. Untuk mengetahui detailnya, lihat Jumlah rata-rata sel per kolom.
Data logis dalam byte logical_data_bytes Jumlah ruang yang ditempati tabel. Untuk mengetahui detailnya, lihat Data logis dalam byte.

Statistik tabel juga mencakup kolom berikut untuk setiap grup kolom dalam tabel.

Kolom statistik keluarga kolom Nama API Deskripsi
Jumlah rata-rata kolom per baris average_columns_per_row Jumlah rata-rata kolom per baris dalam grup kolom. Untuk mengetahui detail dan contohnya, lihat Jumlah rata-rata kolom per baris.
Jumlah rata-rata sel per kolom average_cells_per_column Jumlah sel dalam setiap kolom, dirata-ratakan dari semua baris yang memiliki kolom dalam grup kolom. Untuk mengetahui detail dan contohnya, lihat Jumlah rata-rata sel per kolom.
Data logis dalam byte logical_data_bytes Jumlah ruang yang ditempati oleh grup kolom. Untuk mengetahui detailnya, lihat Data logis dalam byte.

Detail kolom statistik tabel

Jumlah baris

Jumlah baris adalah jumlah baris dalam tabel. Setiap baris diidentifikasi oleh barisnya.

Jumlah rata-rata kolom per baris

Untuk mendapatkan jumlah rata-rata kolom per baris sebuah tabel, Bigtable menghitung jumlah kolom di seluruh tabel dan membagi nilai tersebut dengan jumlah baris dalam tabel.

Sebagai contoh, perhatikan tabel berikut. Baris pertama memiliki tiga kolom, dan baris kedua memiliki dua kolom.

Row key Kolom keluarga-A Keluarga kolom-B
tombol baris 1 family-A:qualifier-W family-A:qualifier-X family-B:qualifier-Y
tombol baris 2 family-A:qualifier-W family-B:qualifier-Z

Tabel ini memiliki lima kolom dan dua baris, sehingga jumlah rata-rata kolom per baris adalah 2.5.

Statistik tabel ini memberi Anda gambaran umum tentang apakah tabel Anda tinggi dan sempit (beberapa kolom per baris) atau pendek dan lebar (banyak kolom di setiap baris).

Jumlah rata-rata sel per kolom

Untuk mendapatkan jumlah rata-rata sel per kolom untuk tabel, Bigtable mengambil jumlah total sel yang disimpan dalam tabel dan membaginya dengan jumlah kolom dalam tabel.

Bergantung pada kebijakan pembersihan sampah memori dan desain skema Anda, tabel Anda mungkin memiliki beberapa sel dalam satu kolom, atau mungkin hanya memiliki satu. Jumlah sel yang dapat Anda simpan terikat oleh batas ukuran data yang diuraikan pada halaman Kuota dan batas di bagian Ukuran data dalam tabel.

Jika Anda mendapati bahwa jumlah ini lebih tinggi dari yang diharapkan, periksa aturan pembersihan sampah memori untuk melihat apakah Anda mempertahankan lebih banyak sel dari yang dibutuhkan. Anda mungkin juga bertanya apakah skema dan pola penulisan Anda harus disesuaikan.

Data logis dalam byte (tabel)

Nilai ini menunjukkan perkiraan jumlah byte yang diperlukan untuk membaca seluruh tabel. Statistik tabel ini memberi Anda gambaran tentang jumlah byte yang disimpan dalam tabel. Mengetahui data logis dalam byte dapat membantu Anda memahami dampak kompresi pada tabel. Misalnya, jika ukuran tabel yang dilaporkan di Cloud Monitoring sama dengan atau lebih besar dari data logis dalam byte untuk tabel, Anda mungkin menyimpan data dalam format yang tidak mudah dikompresi.

Detail bidang statistik keluarga kolom

Statistik tabel untuk tabel mencakup kolom berikut untuk setiap grup kolom dalam tabel.

Jumlah rata-rata kolom per baris

Jumlah ini dihitung dengan mengambil jumlah kolom dalam grup kolom dan membagi angka tersebut dengan jumlah baris dalam tabel.

Sebagai contoh, perhatikan tabel berikut. Tabel ini memiliki tiga baris dengan kolom dalam grup kolom family-A dan family-B.

Row key Kolom keluarga-A Keluarga kolom-B
tombol baris 1 family-A:qualifier-W family-A:qualifier-X family-B:qualifier-Y
tombol baris 2 family-A:qualifier-W
tombol baris 3 family-A:qualifier-W family-A:qualifier-X family-B:qualifier-Y family-B:qualifier-Z

Kelompok kolom family-A memiliki total lima kolom dalam tabel. Dibagi dengan tiga baris, itu berarti jumlah rata-rata sel per kolom untuk family-A adalah 1.67 (dibulatkan di sini menjadi dua angka desimal).

Kelompok kolom family-B memiliki total tiga kolom dalam tabel. Dibagi dengan tiga baris, jumlah rata-rata kolom per baris untuk family-A adalah 1.

Jumlah rata-rata sel per kolom

Untuk menentukan jumlah rata-rata sel per kolom untuk grup kolom, Bigtable menghitung jumlah semua sel dalam grup kolom di semua baris tabel dan membaginya dengan jumlah baris dalam tabel.

Sebagai contoh, perhatikan baris berikut di kelompok kolom family-D.

Row key Kelompok D kolom
tombol baris 1 keluarga-D:penentu-W (3 sel) keluarga-D:penentu-X (1 sel)
tombol baris 2 keluarga-D:penentu-X (10 sel)
tombol baris 3 keluarga-D:penentu-W (7 sel) keluarga-D:penentu-Y (6 sel)

Jumlah sel dalam keluarga kolom adalah 3 + 1 + 10 + 7 + 6 = 27. Nilai tersebut dibagi dengan 3 (jumlah baris) berarti grup kolom family-D memiliki rata-rata sel per kolom 9.

Data logis dalam byte (kelompok kolom)

Data logis dalam byte mencerminkan ruang yang ditempati oleh kelompok kolom. Nilai ini kira-kira jumlah byte yang Anda perlukan untuk membaca semua data dalam grup kolom pada saat statistik tabel ditampilkan.

Contoh penggunaan gcloud CLI

Guna mendapatkan statistik tabel untuk tabel bernama sample-table, gunakan perintah bigtable instances table describe:

gcloud bigtable instances tables describe TABLE_ID \
    --instance=INSTANCE_ID --view stats

Ganti kode berikut:

  • TABLE_ID: ID permanen untuk tabel
  • INSTANCE_ID: ID permanen untuk instance

Outputnya mirip dengan hal berikut ini:

  columnFamilies:
    my-family:
     stats:
       averageCellsPerColumn: 12.34
       averageColumnsPerRow: 56.78
       logicalDataBytes: 314159
  name: projects/my-project/instances/INSTANCE_ID/tables/TABLE_ID
  stats:
    averageCellsPerColumn: 12.34
    averageColumnsPerRow: 56.78
    logicalDataBytes: 314159
    rowCount: 271828

Langkah selanjutnya