ข้ามไปยังเนื้อหาหลัก

การวิเคราะห์

ตอนนี้เราจะวิเคราะห์อัลกอริทึมของ Grover เพื่อทำความเข้าใจว่ามันทำงานอย่างไร เราจะเริ่มต้นด้วยสิ่งที่อาจเรียกได้ว่าเป็นการวิเคราะห์แบบ สัญลักษณ์ ซึ่งเราคำนวณว่าการดำเนินการของ Grover GG กระทำต่อสถานะบางอย่างอย่างไร จากนั้นเราจะเชื่อมโยงการวิเคราะห์เชิงสัญลักษณ์นี้กับ ภาพเรขาคณิต ที่ช่วยให้เห็นภาพการทำงานของอัลกอริทึม

คำตอบและที่ไม่ใช่คำตอบ

มาเริ่มต้นด้วยการกำหนดสองเซตของสตริง

A0={xΣn:f(x)=0}A1={xΣn:f(x)=1}\begin{aligned} A_0 &= \bigl\{ x\in\Sigma^n : f(x) = 0\bigr\} \\ A_1 &= \bigl\{ x\in\Sigma^n : f(x) = 1\bigr\} \end{aligned}

เซต A1A_1 ประกอบด้วยคำตอบทั้งหมดของปัญหาการค้นหา ส่วน A0A_0 ประกอบด้วยสตริงที่ไม่ใช่คำตอบ (ซึ่งเราอาจเรียกว่า ที่ไม่ใช่คำตอบ เมื่อสะดวก) สองเซตนี้มีคุณสมบัติ A0A1=A_0 \cap A_1 = \varnothing และ A0A1=Σn,A_0 \cup A_1 = \Sigma^n, กล่าวคือ นี่คือ การแบ่งสองส่วน ของ Σn.\Sigma^n.

ต่อไปเราจะกำหนดเวกเตอร์หน่วยสองตัวที่แทน superposition สม่ำเสมอเหนือเซตของคำตอบและที่ไม่ใช่คำตอบ

A0=1A0xA0xA1=1A1xA1x\begin{aligned} \vert A_0\rangle &= \frac{1}{\sqrt{\vert A_0\vert}} \sum_{x\in A_0} \vert x\rangle \\ \vert A_1\rangle &= \frac{1}{\sqrt{\vert A_1\vert}} \sum_{x\in A_1} \vert x\rangle \end{aligned}

ในทางการ เวกเตอร์เหล่านี้จะถูกกำหนดเฉพาะเมื่อเซตที่สอดคล้องกันไม่ว่างเปล่า แต่ต่อจากนี้เราจะมุ่งเน้นไปที่กรณีที่ทั้ง A0A_0 และ A1A_1 ไม่ว่างเปล่า กรณีที่ A0=A_0 = \varnothing และ A1=A_1 = \varnothing สามารถจัดการแยกกันได้ง่าย และเราจะทำในภายหลัง

สำหรับข้อสังเกต สัญกรณ์ที่ใช้ที่นี่เป็นเรื่องปกติ: เมื่อใดก็ตามที่เรามีเซตจำกัดและไม่ว่างเปล่า S,S, เราสามารถเขียน S\vert S\rangle เพื่อแทนเวกเตอร์สถานะควอนตัมที่สม่ำเสมอเหนือสมาชิกของ S.S.

ลองกำหนด u\vert u \rangle ให้เป็นสถานะควอนตัม สม่ำเสมอ เหนือสตริง nn บิตทั้งหมด:

u=1NxΣnx.\vert u\rangle = \frac{1}{\sqrt{N}} \sum_{x\in\Sigma^n} \vert x\rangle.

สังเกตว่า

u=A0NA0+A1NA1.\vert u\rangle = \sqrt{\frac{\vert A_0 \vert}{N}} \vert A_0\rangle + \sqrt{\frac{\vert A_1 \vert}{N}} \vert A_1\rangle.

นอกจากนี้เรายังมี u=Hn0n,\vert u\rangle = H^{\otimes n} \vert 0^n \rangle, ดังนั้น u\vert u\rangle แทนสถานะของ register Q\mathsf{Q} หลังจากการตั้งค่าเริ่มต้นในขั้นตอนที่ 1 ของอัลกอริทึมของ Grover

ซึ่งหมายความว่า ก่อนที่การวนซ้ำของ GG จะเกิดขึ้นในขั้นตอนที่ 2 สถานะของ Q\mathsf{Q} อยู่ในปริภูมิเวกเตอร์สองมิติที่ถูก span ด้วย A0\vert A_0\rangle และ A1\vert A_1\rangle และยิ่งกว่านั้น ค่าสัมประสิทธิ์ของเวกเตอร์เหล่านี้เป็นจำนวนจริง ดังที่เราจะเห็น สถานะของ Q\mathsf{Q} จะมีคุณสมบัติเหล่านี้เสมอ — กล่าวคือ สถานะเป็นผลรวมเชิงเส้นจริงของ A0\vert A_0\rangle และ A1\vert A_1\rangle — หลังจากการวนซ้ำใดๆ ของการดำเนินการ GG ในขั้นตอนที่ 2

ข้อสังเกตเกี่ยวกับการดำเนินการของ Grover

ตอนนี้เราจะหันมาสนใจการดำเนินการของ Grover

G=HnZORHnZf,G = H^{\otimes n} Z_{\mathrm{OR}} H^{\otimes n} Z_f,

โดยเริ่มต้นด้วยข้อสังเกตที่น่าสนใจ

ลองจินตนาการว่าเราแทนที่ฟังก์ชัน ff ด้วยการประกอบของ ff กับฟังก์ชัน NOT — หรือพูดอีกอย่างคือ ฟังก์ชันที่ได้จากการกลับบิตเอาต์พุตของ ff เราจะเรียกฟังก์ชันใหม่นี้ว่า g,g, และเราสามารถแสดงมันด้วยสัญลักษณ์ได้หลายวิธี

g(x)=¬f(x)=1f(x)=1f(x)={1f(x)=00f(x)=1g(x) = \neg f(x) = 1 \oplus f(x) = 1 - f(x) = \begin{cases} 1 & f(x) = 0\\[1mm] 0 & f(x) = 1 \end{cases}

สังเกตว่า

(1)g(x)=(1)1f(x)=(1)f(x)(-1)^{g(x)} = (-1)^{1 \oplus f(x)} = - (-1)^{f(x)}

สำหรับทุกสตริง xΣn,x\in\Sigma^n, และดังนั้น

Zg=Zf.Z_g = - Z_f.

ซึ่งหมายความว่า ถ้าเราแทนที่ฟังก์ชัน ff ด้วยฟังก์ชัน gg อัลกอริทึมของ Grover จะไม่ทำงานแตกต่างกันเลย — เพราะสถานะที่เราได้จากอัลกอริทึมในทั้งสองกรณีจำเป็นต้องสมมูลกันจนถึง global phase

นี่ไม่ใช่ปัญหา! ในทางสัญชาตญาณ อัลกอริทึมไม่สนว่าสตริงใดเป็นคำตอบและสตริงใดไม่ใช่ — มันเพียงต้องสามารถ แยกแยะ คำตอบและที่ไม่ใช่คำตอบเพื่อทำงานได้อย่างถูกต้อง

การกระทำของการดำเนินการ Grover

ตอนนี้ลองพิจารณาการกระทำของ GG บนเวกเตอร์สถานะควอนตัม A0\vert A_0\rangle และ A1\vert A_1\rangle

ก่อนอื่น สังเกตว่าการดำเนินการ ZfZ_f มีการกระทำที่เรียบง่ายมากบน A0\vert A_0\rangle และ A1\vert A_1\rangle

ZfA0=A0ZfA1=A1\begin{aligned} Z_f \vert A_0\rangle & = \vert A_0\rangle \\[1mm] Z_f \vert A_1\rangle & = -\vert A_1\rangle \end{aligned}

ประการที่สอง เรามีการดำเนินการ HnZORHn.H^{\otimes n} Z_{\mathrm{OR}} H^{\otimes n}. การดำเนินการ ZORZ_{\mathrm{OR}} ถูกกำหนดเป็น

ZORx={xx=0nxx0n,Z_{\mathrm{OR}} \vert x\rangle = \begin{cases} \vert x\rangle & x = 0^n \\[2mm] -\vert x\rangle & x \neq 0^n, \end{cases}

อีกครั้งสำหรับทุกสตริง xΣn,x\in\Sigma^n, และวิธีที่สะดวกในการแสดงการดำเนินการนี้คือ:

ZOR=20n0nI.Z_{\mathrm{OR}} = 2 \vert 0^n \rangle \langle 0^n \vert - \mathbb{I}.

วิธีง่ายๆ ในการตรวจสอบว่านิพจน์นี้สอดคล้องกับนิยามของ ZORZ_{\mathrm{OR}} คือการประเมินการกระทำของมันบนสถานะ basis มาตรฐาน

การดำเนินการ HnZORHnH^{\otimes n} Z_{\mathrm{OR}} H^{\otimes n} จึงสามารถเขียนได้ดังนี้:

HnZORHn=2Hn0n0nHnI=2uuI,H^{\otimes n} Z_{\mathrm{OR}} H^{\otimes n} = 2 H^{\otimes n} \vert 0^n \rangle \langle 0^n \vert H^{\otimes n} - \mathbb{I} = 2 \vert u \rangle \langle u \vert - \mathbb{I},

โดยใช้สัญกรณ์เดิม u\vert u \rangle ที่เราใช้ข้างต้นสำหรับ superposition สม่ำเสมอเหนือสตริง nn บิตทั้งหมด

และตอนนี้เรามีสิ่งที่จำเป็นในการคำนวณการกระทำของ GG บน A0\vert A_0\rangle และ A1\vert A_1\rangle ก่อนอื่นลองคำนวณการกระทำของ GG บน A0\vert A_0\rangle

GA0=(2uuI)ZfA0=(2uuI)A0=2A0NuA0=2A0N(A0NA0+A1NA1)A0=(2A0N1)A0+2A0A1NA1=A0A1NA0+2A0A1NA1\begin{aligned} G \vert A_0 \rangle & = \bigl( 2 \vert u\rangle \langle u \vert - \mathbb{I}\bigr) Z_f \vert A_0\rangle \\ & = \bigl( 2 \vert u\rangle \langle u \vert - \mathbb{I}\bigr) \vert A_0\rangle \\ & = 2 \sqrt{\frac{\vert A_0\vert}{N}} \vert u\rangle -\vert A_0 \rangle\\ & = 2 \sqrt{\frac{\vert A_0\vert}{N}} \biggl( \sqrt{\frac{\vert A_0\vert}{N}} \vert A_0\rangle + \sqrt{\frac{\vert A_1\vert}{N}} \vert A_1\rangle\biggr) -\vert A_0 \rangle \\ & = \biggl( \frac{2\vert A_0\vert}{N} - 1\biggr) \vert A_0 \rangle + \frac{2 \sqrt{\vert A_0\vert \cdot \vert A_1\vert}}{N} \vert A_1 \rangle \\ & = \frac{\vert A_0\vert - \vert A_1\vert}{N} \vert A_0 \rangle + \frac{2 \sqrt{\vert A_0\vert \cdot \vert A_1\vert}}{N} \vert A_1 \rangle \end{aligned}

และประการที่สอง ลองคำนวณการกระทำของ GG บน A1\vert A_1\rangle

GA1=(2uuI)ZfA1=(2uuI)A1=2A1Nu+A1=2A1N(A0NA0+A1NA1)+A1=2A1A0NA0+(12A1N)A1=2A1A0NA0+A0A1NA1\begin{aligned} G \vert A_1 \rangle & = \bigl( 2 \vert u\rangle \langle u \vert - \mathbb{I} \bigr) Z_f \vert A_1\rangle \\ & = - \bigl( 2 \vert u\rangle \langle u \vert - \mathbb{I} \bigr) \vert A_1\rangle \\ & = - 2 \sqrt{\frac{\vert A_1\vert}{N}} \vert u\rangle + \vert A_1 \rangle \\ & = - 2 \sqrt{\frac{\vert A_1\vert}{N}} \biggl(\sqrt{\frac{\vert A_0\vert}{N}} \vert A_0\rangle + \sqrt{\frac{\vert A_1\vert}{N}} \vert A_1\rangle\biggr) + \vert A_1 \rangle \\ & = - \frac{2 \sqrt{\vert A_1\vert \cdot \vert A_0\vert}}{N} \vert A_0 \rangle + \biggl( 1 - \frac{2\vert A_1\vert}{N} \biggr) \vert A_1 \rangle \\ & = - \frac{2 \sqrt{\vert A_1\vert \cdot \vert A_0\vert}}{N} \vert A_0 \rangle + \frac{\vert A_0\vert - \vert A_1\vert}{N} \vert A_1 \rangle \end{aligned}

ในทั้งสองกรณีเราใช้สมการ

u=A0NA0+A1NA1\vert u\rangle = \sqrt{\frac{\vert A_0 \vert}{N}} \vert A_0\rangle + \sqrt{\frac{\vert A_1 \vert}{N}} \vert A_1\rangle

พร้อมกับนิพจน์

uA0=A0NanduA1=A1N\langle u \vert A_0\rangle = \sqrt{\frac{\vert A_0 \vert}{N}} \qquad\text{and}\qquad \langle u \vert A_1\rangle = \sqrt{\frac{\vert A_1 \vert}{N}}

ที่ตามมา

โดยสรุป เรามี

GA0=A0A1NA0+2A0A1NA1GA1=2A1A0NA0+A0A1NA1.\begin{aligned} G \vert A_0 \rangle & = \frac{\vert A_0\vert - \vert A_1\vert}{N} \vert A_0 \rangle + \frac{2 \sqrt{\vert A_0\vert \cdot \vert A_1\vert}}{N} \vert A_1 \rangle\\[2mm] G \vert A_1 \rangle & = - \frac{2 \sqrt{\vert A_1\vert \cdot \vert A_0\vert}}{N} \vert A_0 \rangle + \frac{\vert A_0\vert - \vert A_1\vert}{N} \vert A_1 \rangle. \end{aligned}

ดังที่เราสังเกตไปแล้ว สถานะของ Q\mathsf{Q} ก่อนขั้นตอนที่ 2 อยู่ในปริภูมิสองมิติที่ถูก span ด้วย A0\vert A_0\rangle และ A1,\vert A_1\rangle, และเราได้พิสูจน์แล้วว่า GG แมปเวกเตอร์ใดๆ ในปริภูมินี้ไปยังเวกเตอร์อื่นในปริภูมิเดิม ซึ่งหมายความว่า เพื่อวัตถุประสงค์ของการวิเคราะห์ เราสามารถมุ่งความสนใจไปที่ subspace นี้เท่านั้น

เพื่อให้เข้าใจได้ดีขึ้นว่าเกิดอะไรขึ้นภายในปริภูมิสองมิตินี้ ลองแสดงการกระทำของ GG บนปริภูมินี้เป็น matrix

M=(A0A1N2A1A0N2A0A1NA0A1N),M = \begin{pmatrix} \frac{\vert A_0\vert - \vert A_1\vert}{N} & -\frac{2 \sqrt{\vert A_1\vert \cdot \vert A_0\vert}}{N} \\[2mm] \frac{2 \sqrt{\vert A_0\vert \cdot \vert A_1\vert}}{N} & \frac{\vert A_0\vert - \vert A_1\vert}{N} \end{pmatrix},

โดยที่แถว/คอลัมน์แรกและที่สองสอดคล้องกับ A0\vert A_0\rangle และ A1\vert A_1\rangle ตามลำดับ จนถึงตอนนี้ในซีรีส์นี้ เราเชื่อมโยงแถวและคอลัมน์ของ matrix กับสถานะแบบ classical ของระบบเสมอ แต่ matrix ยังสามารถใช้อธิบายการกระทำของการแมปเชิงเส้นบน basis ต่างๆ อย่างที่เราทำที่นี่

แม้ว่าจะไม่ชัดเจนในทันที matrix MM คือสิ่งที่ได้จากการ ยกกำลังสอง ของ matrix ที่ดูเรียบง่ายกว่า

(A0NA1NA1NA0N)2=(A0A1N2A1A0N2A0A1NA0A1N)=M\begin{pmatrix} \sqrt{\frac{\vert A_0\vert}{N}} & - \sqrt{\frac{\vert A_1\vert}{N}} \\[2mm] \sqrt{\frac{\vert A_1\vert}{N}} & \sqrt{\frac{\vert A_0\vert}{N}} \end{pmatrix}^2 = \begin{pmatrix} \frac{\vert A_0\vert - \vert A_1\vert}{N} & -\frac{2 \sqrt{\vert A_1\vert \cdot \vert A_0\vert}}{N} \\[2mm] \frac{2 \sqrt{\vert A_0\vert \cdot \vert A_1\vert}}{N} & \frac{\vert A_0\vert - \vert A_1\vert}{N} \end{pmatrix} = M

matrix

(A0NA1NA1NA0N)\begin{pmatrix} \sqrt{\frac{\vert A_0\vert}{N}} & - \sqrt{\frac{\vert A_1\vert}{N}} \\[2mm] \sqrt{\frac{\vert A_1\vert}{N}} & \sqrt{\frac{\vert A_0\vert}{N}} \end{pmatrix}

คือ rotation matrix ซึ่งเราสามารถแสดงในรูปแบบอื่นได้เป็น

(A0NA1NA1NA0N)=(cos(θ)sin(θ)sin(θ)cos(θ))\begin{pmatrix} \sqrt{\frac{\vert A_0\vert}{N}} & - \sqrt{\frac{\vert A_1\vert}{N}} \\[2mm] \sqrt{\frac{\vert A_1\vert}{N}} & \sqrt{\frac{\vert A_0\vert}{N}} \end{pmatrix} = \begin{pmatrix} \cos(\theta) & -\sin(\theta) \\[2mm] \sin(\theta) & \cos(\theta) \end{pmatrix}

สำหรับ

θ=sin1(A1N).\theta = \sin^{-1}\biggl(\sqrt{\frac{\vert A_1\vert}{N}}\biggr).

มุม θ\theta นี้จะมีบทบาทสำคัญมากในการวิเคราะห์ที่ตามมา จึงควรเน้นความสำคัญของมันในครั้งแรกที่เราพบ

เมื่อพิจารณาจากการแสดงนิพจน์ของ matrix นี้ เราสังเกตว่า

M=(cos(θ)sin(θ)sin(θ)cos(θ))2=(cos(2θ)sin(2θ)sin(2θ)cos(2θ)).M = \begin{pmatrix} \cos(\theta) & -\sin(\theta) \\[2mm] \sin(\theta) & \cos(\theta) \end{pmatrix}^2 = \begin{pmatrix} \cos(2\theta) & -\sin(2\theta) \\[2mm] \sin(2\theta) & \cos(2\theta) \end{pmatrix}.

เพราะการหมุนด้วยมุม θ\theta สองครั้งเทียบเท่ากับการหมุนด้วยมุม 2θ2\theta อีกวิธีหนึ่งในการเห็นสิ่งนี้คือการใช้นิพจน์อื่น

θ=cos1(A0N),\theta = \cos^{-1}\biggl(\sqrt{\frac{\vert A_0\vert}{N}}\biggr),

พร้อมกับสูตร double angle จากตรีโกณมิติ:

cos(2θ)=cos2(θ)sin2(θ)sin(2θ)=2sin(θ)cos(θ).\begin{aligned} \cos(2\theta) & = \cos^2(\theta) - \sin^2(\theta)\\[1mm] \sin(2\theta) & = 2 \sin(\theta)\cos(\theta). \end{aligned}

โดยสรุป สถานะของ register Q\mathsf{Q} ณ จุดเริ่มต้นของขั้นตอนที่ 2 คือ

u=A0NA0+A1NA1=cos(θ)A0+sin(θ)A1,\vert u\rangle = \sqrt{\frac{\vert A_0\vert}{N}} \vert A_0\rangle + \sqrt{\frac{\vert A_1\vert}{N}} \vert A_1\rangle = \cos(\theta) \vert A_0\rangle + \sin(\theta) \vert A_1\rangle,

และผลของการนำ GG ไปใช้กับสถานะนี้คือการหมุนมันด้วยมุม 2θ2\theta ภายในปริภูมิที่ถูก span ด้วย A0\vert A_0\rangle และ A1\vert A_1\rangle ตัวอย่างเช่น เรามี

Gu=cos(3θ)A0+sin(3θ)A1G2u=cos(5θ)A0+sin(5θ)A1G3u=cos(7θ)A0+sin(7θ)A1\begin{aligned} G \vert u \rangle &= \cos(3\theta) \vert A_0\rangle + \sin(3\theta) \vert A_1\rangle\\[1mm] G^2 \vert u \rangle &= \cos(5\theta) \vert A_0\rangle + \sin(5\theta) \vert A_1\rangle\\[1mm] G^3 \vert u \rangle &= \cos(7\theta) \vert A_0\rangle + \sin(7\theta) \vert A_1\rangle \end{aligned}

และโดยทั่วไป

Gtu=cos((2t+1)θ)A0+sin((2t+1)θ)A1.G^t \vert u \rangle = \cos\bigl((2t + 1)\theta\bigr) \vert A_0\rangle + \sin\bigl((2t + 1)\theta\bigr) \vert A_1\rangle.

ภาพเรขาคณิต

ตอนนี้ลองเชื่อมโยงการวิเคราะห์ที่เราเพิ่งผ่านไปกับภาพเรขาคณิต แนวคิดคือการดำเนินการ GG คือผลคูณของ การสะท้อน สองครั้ง ได้แก่ ZfZ_f และ HnZORHnH^{\otimes n} Z_{\mathrm{OR}} H^{\otimes n} และผลสุทธิของการทำ reflection สองครั้งคือการทำ rotation

เริ่มจาก ZfZ_f ดังที่เราสังเกตไว้ก่อนหน้านี้ เรามี

ZfA0=A0ZfA1=A1.\begin{aligned} Z_f \vert A_0\rangle & = \vert A_0\rangle \\[1mm] Z_f \vert A_1\rangle & = -\vert A_1\rangle. \end{aligned}

ภายในปริภูมิเวกเตอร์สองมิติที่ถูก span ด้วย A0\vert A_0\rangle และ A1,\vert A_1\rangle, นี่คือ การสะท้อน เกี่ยวกับเส้นที่ขนานกับ A0\vert A_0\rangle ซึ่งเราจะเรียกว่า L1L_1 ต่อไปนี้คือรูปที่แสดงการกระทำของการสะท้อนนี้บนเวกเตอร์หน่วยสมมติ ψ,\vert\psi\rangle, ซึ่งเราสมมติว่าเป็นผลรวมเชิงเส้นจริงของ A0\vert A_0\rangle และ A1\vert A_1\rangle

รูปที่แสดงการกระทำของการสะท้อนบนเวกเตอร์

ประการที่สอง เรามีการดำเนินการ HnZORHn,H^{\otimes n} Z_{\mathrm{OR}} H^{\otimes n}, ซึ่งเราได้เห็นแล้วว่าสามารถเขียนได้เป็น

HnZORHn=2uuI.H^{\otimes n} Z_{\mathrm{OR}} H^{\otimes n} = 2 \vert u \rangle \langle u \vert - \mathbb{I}.

นี่ก็เป็นการสะท้อนเช่นกัน คราวนี้เกี่ยวกับเส้น L2L_2 ที่ขนานกับเวกเตอร์ u\vert u\rangle ต่อไปนี้คือรูปที่แสดงการกระทำของการสะท้อนนี้บนเวกเตอร์หน่วย ψ\vert\psi\rangle

รูปที่แสดงการกระทำของการสะท้อนครั้งที่สองบนเวกเตอร์

เมื่อเราประกอบการสะท้อนสองครั้งนี้ เราจะได้การหมุน — ด้วยสองเท่าของมุมระหว่างเส้นสะท้อน — ดังที่รูปนี้แสดง

รูปที่แสดงการกระทำของการดำเนินการ Grover บนเวกเตอร์

นี่อธิบายในแง่เรขาคณิตว่าทำไมผลของการดำเนินการ Grover จึงเป็นการหมุนผลรวมเชิงเส้นของ A0\vert A_0\rangle และ A1\vert A_1\rangle ด้วยมุม 2θ2\theta

Source: IBM Quantum docs — updated 15 ม.ค. 2569
English version on doQumentation — updated 7 พ.ค. 2569
This translation based on the English version of approx. 26 มี.ค. 2569