แสดงบทความที่มีป้ายกำกับ Gaussian แสดงบทความทั้งหมด
แสดงบทความที่มีป้ายกำกับ Gaussian แสดงบทความทั้งหมด

วันอังคารที่ 3 กรกฎาคม พ.ศ. 2561

รู้ทันนักวิจัย (๑๔) แต่งผล XRD ด้วยการทำ Peak fitting ตอนที่ ๒ อยากจะให้อยู่ทางซ้ายหรืออยู่ทางขวา MO Memoir : Tuesday 3 July 2561

ในตอนแรกของเรื่องนี้ (รู้ทันนักวิจัย (๑๓)) ได้ยกตัวอย่างกรณีของพีคที่เห็นว่าเป็นพีคเดี่ยว ที่จะมองว่ามีอยู่เพียงพีคเดียว หรือจะมองให้ละเอียดว่าเป็นพีคผสมระหว่างพีคใหญ่กับพีคเล็กก็ได้ มาในวันนี้จะเป็นการยกตัวอย่างกรณีที่เห็นชัดเจนว่ามีสองพีคเบียดกันอยู่ กราฟ XRD ที่เอามาเป็นตัวอย่างในวันนี้เป็นกราฟเดียวกันกับตอนที่แล้ว เพียงแต่จะใช้พีคที่ปรากฏในช่วงมุม 2 Theta 50-60º (รูปที่ ๑)


รูปที่ ๑ กราฟ XRD ของตัวเร่งปฏฺกิริยา V2O5-MgO/TiO2 รูปบนคือผลการสแกนรวม รูปล่างคือภาพขยายของพีคในกรอบสีเหลี่ยมสีแดงในรูปบน ส่วนข้อมูลในกรอบสีเขียวรูปล่างเป็นส่วนที่มีพีคย่อยซ้อนทับอยู่ และไม่นำมาใช้ในการทำ curve fitting โดยการทำ curve fitting ยังคงใช้โปรแกรม fityk 0.9.8 เช่นเดิม
 
พีคที่จะทำการพิจารณานั้นเป็นพีคที่มุม 2 Theta ประมาณ 53.8º และ 54.3º และอีกพีคหนึ่งที่มุม 2 Theta ประมาณ 55.0º โดย 2 พีคแรกนั้นเป็นพีคที่เหลื่อมซ้อนกันมาก และเพื่อที่จะทำ peak fitting ทั้ง 3 พีคดังกล่าวจึงได้ทำการตัดข้อมูลที่อยู่ในช่วงมุม 2 Theta ประมาณ 54.4º ถึง 57.6º ออกไป เพราะบริเวณดังกล่าวมีพีคเล็ก ๆ ปรากฏอยู่หลายพีค ส่วนข้อมูลที่อยู่ในช่วงมุม 2 Theta จาก 57.6º ไปจนถึง 60.0º นั้นยังเก็บเอาไว้อยู่ เพราะจำเป็นต้องใช้ในการสร้างส่วนฐานของพีคทั้งสาม
 
การทำ peak fitting ยังคงใช้โปรแกรม fityk 0.9.8 เหมือนเดิม โดยใช้วิธีให้โปรแกรมเลือกวางตำแหน่งพีคเริ่มต้นจำนวน 3 พีคให้ก่อน จากนั้นจึงค่อยทำการ regression ผลที่ได้แสดงไว้ในรูปที่ ๒ โดยรูปที่ ๒ (บน) นั้นสมมุติให้แต่ละพีคมีการกระจายตัวแบบ Gaussian ส่วนรูปที่ ๒ (ล่าง) นั้นสมมุติให้แต่ละพีคมีการกระจายตัวแบบ Lorentzian (หรือ Cauchy)
  

รูปที่ ๒ ผลการทำ peak fittting ด้วย (บน) Gaussian function และ (ล่าง) Lorentzian function
 
ผลการทำ regression ปรากฏว่าฟังก์ชันการกระจายตัวทั้งสองแบบนั้นให้ตำแหน่งและความสูงของพีคที่ มุม 2 Theta 55.0º ใกล้เคียงกัน แต่ที่แตกต่างกันก็คือขนาดของพีค A และ B ในรูปที่ ๒ โดยในกรณีของการใช้ฟังก์ชันการกระจายตัวแบบ Gaussian นั้นให้พีค A อยู่ที่ตำแหน่ง 2 Theta ประมาณ 53.9º และพีค B อยู่ที่ตำแหน่ง 2 Theta ประมาณ 54.1º โดยพีค A มีขนาดเล็กมากเมื่อเทียบกับพีค B (พื้นที่พีค A ประมาณ 5% ของพื้นที่พีค B) แต่พอใช้ฟังก์ชันการกระจายตัวแบบ Lorentzian นั้นจะได้พีค A อยู่ที่ตำแหน่ง 2 Theta ประมาณ 53.9º และพีค B อยู่ที่ตำแหน่ง 2 Theta ประมาณ 54.3º โดยพีค A มีขนาดใหญ่กว่าพีค B ประมาณเท่าตัว (พื้นที่พีค B ประมาณ 42% ของพื้นที่พีค A)

เพราะเหตุนี้ไงครับ ผมจึงตั้งชื่อเรื่องว่า "อยากจะให้อยู่ทางซ้ายหรือทางขวา" เพราะเราสามารถใช้คณิตศาสตร์ช่วยหาข้ออ้างให้เราได้

รูปที่ ๓ นำมาจากบทความเรื่อง Peak profile analysis in X-ray powder diffraction ที่เขียนโดย Frank Girgsdies ในบทนี้กล่าวไว้ว่ารูปแบบการกระจายแบบ Gauss และ Lorentzian นั้นอาจถือได้ว่าเป็นขอบเขต (ที่อยู่กันคนละฟาก) ของการกระจายตัวของพีค (คือรูปแบบ Gauss จะเป็นขอบเขตด้านความกว้างที่มากที่สุดและความสูงที่ต่ำสุด ส่วนรูปแบบ Lorentzian จะเป็นขอบเขตด้านความกว้างที่แคบที่สุดและความสูงที่สูงที่สุด) โดยฟังก์ชันที่อยู่ระหว่างกลางคือ Voigt (ที่เป็นผลรวมของ Gaussian และ Lorentzian) แต่ตัวฟังก์ชัน Voigt นี้คำนวณยาก จึงมีการใช้ฟังก์ชัน psuedo-Voigt ในการประมาณค่าแทน (โปรแกรม fityk มีฟังก์ชันเหล่านี้อยู่ในโปรแกรม)

รูปที่ ๓ คำอธิบายรูปแบบการกระจายตัวของพีค XRD รายละเอียดที่มาของเอกสารดังกล่าวและผู้เขียน ปรากฏอยู่ในรูปแล้ว สามารถหาดาวน์โหลดไฟล์ได้ทางอินเทอร์เน็ต

สิ่งสำคัญสิ่งหนึ่งเมื่อต้องทำ nonlinear regression คือ "ทำใจ" เพราะด้วยข้อมูลเดียวกัน เลือกใช้ฟังก์ชันเดียวกัน ใช้จำนวนพีคเท่ากัน แต่ใช้ขนาดและการวางตำแหน่งเริ่มต้นที่แตกต่างกัน ก็ให้ผลการคำนวณที่แตกต่างกันได้แม้ว่าค่าความคลาดเคลื่อนที่หลงเหลืออยู่โดยรวมนั้นจะออกมาที่ระดับเดียวกัน ดังนั้นสิ่งที่ควรทำก็คือพิจารณากราฟผลรวมและข้อมูลอื่นประกอบด้วยว่าผลการทำ peak fitting อันไหนที่น่าจะตรงกับข้อมูลที่มีอยู่มากที่สุด โดยไม่ควรพิจารณาเพียงแค่ตัวเลขผลรวมความคลาดเคลื่อนที่หลงเหลืออยู่ เพราะการใส่พีคเข้าไปเยอะ ๆ (แม้ว่าจะใช้ฟังก์ชันที่ผิด) ก็ทำให้ได้ค่าตัวเลขผลรวมความคลาดเคลื่อนที่หลงเหลือนั้นลดต่ำลงเข้าหาศูนย์ได้เช่นกัน ... จบตอนที่ ๒

วันจันทร์ที่ 2 กรกฎาคม พ.ศ. 2561

รู้ทันนักวิจัย (๑๓) แต่งผล XRD ด้วยการทำ Peak fitting ตอนที่ ๑ ควรมีสักกี่พีค MO Memoir : Monday 2 July 2561

ผลการวิเคราะห์ด้วยเครื่องมือวิเคราะห์หลายหลายชนิดนั้นได้สัญญาณออกมาในรูปของพีค (peak) ที่การแปลผลนั้นต้องอาศัยตำแหน่งและขนาด (ความสูง ความกว้าง และพื้นที่ใต้พีค) ของพีคนั้น โดยตำแหน่งที่เกิดมักจะเป็นตัวบอกว่าพีคนั้นเป็นพีคของสารใด (เช่นในกรณีของแก๊สโครมาโทกราฟ) หรือโครงสร้างใด (เช่นในกรณีของอินฟราเรด) ในขณะที่ขนาด (ความสูง ความกว้าง และพื้นที่ใต้พีค) มักจะเป็นตัวบ่งบอกปริมาณและ/หรือพารามิเตอร์ต่าง ๆ ที่ส่งผลต่อการเกิดพีคนั้น
 
พีคสัญญาณ XRD เป็นตัวแทนพีคที่เกิดจากการหักเหรังสีเอ็กซ์จากโครงร่างผลึกเมื่อมองจากมุมมองต่างกัน การมองด้วยมุมมองที่ต่างกันทำให้เห็นระยะห่างระหว่างชั้นอะตอม (หรือไอออน) ที่อยู่ด้านบนกับชั้นอะตอม (หรือไอออน) ที่เรียงซ้อนกันอยู่ต่ำลงไปนั้นมีระยะที่แตกต่างกัน สำหรับผลึกแต่ละชนิดนั้น พีค XRD เปรียบเสมือนลายนิ้วมือของผลึกนั้น กล่าวอีกนัยหนึ่งคือไม่มีพีค XRD ของผลึกใดจะเหมือนกันเลย คุณสมบัติเช่นนี้จึงทำให้นิยมใช้เทคนิค XRD ในการระบุตัวอย่างที่เป็นผลึกของแข็งว่าเป็นสารใด
 
ในช่วงไม่นานนี้มีความนิยมนำเอาผล XRD มาใช้ในการระบุ "ขนาด" ของผลึกกันมากขึ้น การระบุขนาดผลึกนี้อาศัยค่าความกว้างของพีคที่ระยะครึ่งหนึ่งของค่าความสูงของพีค แล้วนำไปแทนค่าในสมการที่รู้จักกันในชื่อ Scherrer's equation ที่เป็นสมการสำหรับคำนวณ "ความหนาของระนาบ" ที่สะท้อนรังสีเอ็กซ์ที่มุมนั้นออกมา
 
เวลาที่กล่าวถึงคำว่า "ขนาด" ก็ควรหมายถึงมิติของรูปทรง ๓ มิติ หรือตัวเลขที่แสดงค่าเฉลี่ยของมิติทั้ง ๓ มิติ ในขณะที่ "ความหนาของระนาบ" นั้นมีความหมายเพียงแค่มิติเดียว และจุดนี้ก็เป็นประเด็นหนึ่งที่ควรพิจารณาเมื่อมีการกล่าวถึงการระบุ "ขนาด" ของผลึกด้วยการใช้ Scherrer's equation ว่าเป็นค่าที่ได้จากพีคเพียงพีคเดียว หรือค่าเฉลี่ยจากหลายพีค

เรื่องของ Scherrer's equation นั้นเคยกล่าวไว้หลายครั้งแล้วใน Memoir ฉบับก่อนหน้านี้ดังนี้
ปีที่ ๒ ฉบับที่ ๙๙ วันพฤหัสบดีที่ ๑๔ มกราคม ๒๕๕๓ เรื่อง "Scherrer's equation"
ปีที่ ๒ ฉบับที่ ๑๐๔ วันพฤหัสบดีที่ ๒๑ มกราคม ๒๕๕๓ เรื่อง "Scherrer's equation (ตอนที่ ๒)"
ปีที่ ๖ ฉบับที่ ๖๘๑ วันพฤหัสบดีที่ ๑๐ ตุลาคม ๒๕๕๖ เรื่อง "Scherrer's equation (ตอนที่ ๓)" และ
ปีที่ ๗ ฉบับที่ ๙๐๘ วันจันทร์ที่ ๒๒ ธันวาคม ๒๕๕๗ เรื่อง "Scherrer's equation (ตอนที่ ๔)"

ลักษณะเส้น base line ของกราฟ XRD นั้นสัญญาณจะมีค่ามากที่ค่า 2 Theta น้อย ๆ อันเป็นผลจากการที่รังสีเอ็กซ์จากแหล่งกำเนิดส่วนหนึ่งสามารถเดินทางไปยัง detector ได้โดยตรงโดยไม่ได้เกิดจากการหักเหจากผลึกตัวอย่าง แต่สัญญาณจะลดระดับลงอย่างรวดเร็วจนถือได้ว่า base line อยู่ในระดับที่ราบที่ค่า 2 Theta เพิ่มสูงขึ้น แนวเส้น base line นั้นไม่ส่งผลต่อ "ตำแหน่ง" พีค แต่ส่งผลต่อ "ความสูง" ของพีค ซึ่งประเด็นเรื่องความสูงนี้ขอเก็บเอาไว้ก่อน เพราะประเด็นที่อยากเล่าในวันนี้ก็คือพีคที่เห็นว่ามีเพียง "พีคเดียว" นั้น สามารถทำให้มีหลายพีคได้หรือไม่ด้วยการทำ peak deconvolution หรือ peak fitting โดยผล XRD ที่เอามาเป็นตัวอย่างในวันนี้เป็นตัวเร่งปฏิกิริยา V2O5-MgO/TiO2 ที่นำกราฟ XRD มาแสดงในรูปที่ ๑ โดยวันนี้จะลองพิจารณาพีคที่ตำแหน่ง 2 Theta ประมาณ 48º กันก่อน
 
การทำ peak deconvolution หรือ peak fitting ในวันนี้อาศัยโปรแกรม fityk 0.9.8 ที่เป็น freeware

รูปที่ ๑ กราฟ XRD ของตัวเร่งปฏฺกิริยา V2O5-MgO/TiO2 รูปบนคือผลการสแกนรวม ส่วนรูปล่างเป็นภาพขยายของพีคที่ตำแหน่ง 2 Theta ประมาณ 48º ที่ผ่านการตัด base line แล้ว (แนวเส้นประสีแดงในรูปบน) ด้วยโปรแกรม fityk 0.9.8

ในรูปที่ ๑ (ล่าง) จะเห็นได้ว่าพีคที่ตำแหน่ง 2 Theta ประมาณ 48º นี้เป็นพีคที่ไม่สมมาตรอยู่เล็กน้อย กล่าวคือทางด้านซ้ายค่อนข้างจะกว้างกว่าทางด้านขวาอยู่เล็กน้อย ถ้าเราคิดว่าที่ตำแหน่งนี้มีพีคเพียงแต่พีคเดียว และต้องการค่าความกว้างของพีคที่ระยะครึ่งหนึ่งของค่าความสูงของพีคเพื่อนำไปใช้กับ Scherrer's equation นั้น พอตัด base line แล้วเราก็สามารถอ่านค่าความกว้างของพีคจากกราฟได้เลย แต่ถ้าต้องการค่าพารามิเตอร์ของฟังก์ชันที่เป็นตัวแทนพีคนั้น เพื่อนำไปใช้ในการคำนวณอื่น (เช่นการหาพื้นที่ใต้พีค) เราจำเป็นต้องทำ peak fitting กับข้อมูลดิบดังกล่าว และคำถามแรกที่ปรากฏขึ้นมาก็คือ เราควรใช้ distribution function ตัวไหนมาทำ peak fitting กับพีคดังกล่าว
 
ในกรณีของผล XRD นั้น distribution function ที่มีการนำมาทำ peak fitting หลัก ๆ ก็มีอยู่ ๒ ฟังก์ชันด้วยกัน ฟังก์ชันแรกเป็นฟังก์ชันที่จากประสบการณ์ที่ผ่านมามักเห็นกลุ่มวิจัยต่าง ๆ ในบ้านเราที่ทำวิจัยทางด้านตัวเร่งปฏิกิริยาชอบใช้กันคือสมมุติให้การกระจายตัวเป็นแบบ Gaussian distribution ในขณะที่ก็มีบางตำรานั้นกล่าวว่า distribution function ที่เหมาะสมมากกว่าคือ Cauchy หรืออีกชื่อคือ Lorentzian distribution (ในที่นี้ขอเรียกว่า Lorentzian เพื่อให้ตรงกับที่โปรแกรม fityk ใช้) แต่ทั้งนี้ก็ต้องพิจารณาตามสภาพการณ์ คือในบางกรณีนั้นการใช้ Lorentzian distribution จะให้ผลที่ดีกว่า แต่ก็มีหลายกรณีที่ทั้งสองฟังก์ชันให้ผลทัดเทียมกัน (ดูตัวอย่างการใช้ฟังก์ชันเหล่านี้เพิ่มเติมได้ใน Memoir ปีที่ ๓ ฉบับที่ ๒๖๑ วันศุกร์ที่ ๑๘ กุมภาพันธ์ ๒๕๕๔ เรื่อง "XRD - peak fitting")
 
รูปที่ ๒ นั้นเป็นการทำ peak fitting โดยสมมุติว่าพีคที่ตำแหน่งดังกล่าวมีพีคเพียงแค่พีคเดียว การทำใช้โปรแกรม fityk 0.9.8 โดยหลังจากตัด base line แล้วก็ให้โปรแกรมเป็นผู้เลือกวางตำแหน่งพีคเริ่มต้น จากนั้นก็ให้โปรแกรมเริ่มทำ regression จนโปรแกรมพบว่าไม่สามารถปรับค่าให้ดีขึ้นได้อีก รูปที่ ๒ (บน) นั้นใช้พีคเริ่มต้นเป็นชนิด Gaussian ส่วนรูปที่ ๒ (ล่าง) นั้นใช้พีคเริ่มต้นเป็นชนิด Lorentzian สิ่งที่ควรพิจารณาจากพีคที่ได้ก็คือ ความสูงของพีค ลักษณะรูปทรงบริเวณตอนกลางของพีค และลักษณะการลู่เข้าหา base line ที่ส่วนฐานของพีค ซึ่งในกรณีนี้พบว่าการทำ peak fitting ด้วยฟังก์ชัน Lorentzian นั้นให้ผลที่ดีว่า


รูปที่ ๒ ผลการทำ peak fitting โดยสมมุติว่ามีเพียงพีคเดียว และมีการกระจายตัวแบบ (บน) Gaussian ที่ให้ค่าความกว้างของพีคที่ระยะครึ่งหนึ่งของค่าความสูงของพีคเท่ากับ 0.644º หรือ (ล่าง) Lorentzian ที่ให้ค่าความกว้างของพีคที่ระยะครึ่งหนึ่งของค่าความสูงของพีคเท่ากับ 0.454º
 
รูปที่ ๓ เป็นการทำ peak fitting โดยสมมุติว่าพีคที่ตำแหน่งดังกล่าวมี ๒ พีคซ้อนกันอยู่ การทำ peak fitting ครั้งนี้เริ่มจากการให้โปรแกรมเลือกวางตำแหน่งพีคที่หนึ่งและพีคที่สอง จากนั้นจึงค่อยเริ่มทำการ regression ในกรณีนี้ถ้ามองโดยภาพรวมโดยพิจารณากราฟผลรวมของทั้ง ๒ พีคจะเห็นว่าการใช้พีคชนิด Gaussina หรือ Lorentzian นั้นให้ผลที่ทัดเทียมกัน ไม่ว่าจะเป็นในส่วนของความสูง การสอดรับกับรูปทรงของพีค และลักษณะการลู่เข้าหาเส้น base line

รูปที่ ๓ ผลการทำ peak fitting โดยสมมุติว่าพีคดังกล่าวประกอบลด้วยพีคสองพีค และมีการกระจายตัวแบบ (บน) Gaussian หรือ (ล่าง) Lorentzian
แต่ถ้าดูจากลักษณะของพีคย่อยที่เป็นองค์ประกอบ จะเห็นว่ามีความแตกต่างกันอยู่
 
กล่าวคือในกรณีของฟังก์ชัน Gaussian นั้นบอกว่ามีพีคขนาดใหญ่และกว้างที่ค่า 2 Theta ประมาณ 47.8º ในขณะที่พีคที่ตำแหน่ง 2 Theta ประมาณ 48.0º นั้นแม้จะสูงกว่า แต่ก็แคบกว่าและมีพื้นที่พีคที่ต่ำกว่า โดยค่าความกว้างของพีคที่ระยะครึ่งหนึ่งของค่าความสูงของพีคนั้นคือ 0.928º และ 0.366º ตามลำดับ ในขณะที่ฟังก์ชัน Lorentzian นั้นบอกว่ามีพีคขนาดใหญ่และแคบที่ค่า 2 Theta ประมาณ 48.0º และพีคที่เล็กกว่า (ทั้งความสูงและพื้นที่ใต้พีค) ที่ค่า 2 Theta ประมาณ 47.8º โดยค่าความกว้างของพีคที่ระยะครึ่งหนึ่งของค่าความสูงของพีคนั้นคือ 0.340º และ 0.472º ตามลำดับ
 
ทีนี้ด้วยข้อมูลดิบเดียวกัน ถ้าต้องการบอกว่ามีผลึกอยู่ ๒ ขนาด ถ้าใช้ฟังก์ชัน Gaussian จะได้ผลึกที่มีขนาดแตกต่างกันประมาณ 2.5 เท่า โดยผลึกที่ให้พีคที่ ค่า 2 Theta ประมาณ 47.8º เป็นผลึกที่มีขนาดเล็กมาก (ก็ตัวหารมันมีค่ามาก) แต่ถ้าใช้ฟังก์ชัน Lorentzian จะได้ผลึกที่มีขนาดแตกต่างกันเพียงประมาณ 1.4 เท่า และเป็นผลึกที่มีขนาดใหญ่กว่าการใช้ฟังก์ชัน Gaussian ในการทำ peak fitting ด้วย
โดยความเห็นส่วนตัวแล้ว ผมเห็นว่าพีคดังกล่าวเป็นผลรวมของ ๒ พีค ที่พีคด้านซ้ายมีขนาดเล็กว่าพีคด้านขวา จึงทำให้พีคมีการโป่งนูนขึ้นเล็กน้อยทางด้านซ้าย (เรื่องปรกติที่มักพบเห็นกันในกรณีที่พบพีคมีการโป่งนูนเล็กน้อย) แต่ทั้งนี้ก็ควรพึงระลึกด้วยว่า ด้วยข้อมูลเดียวกัน ถ้าใช้การเริ่มวางพีคและการทำ regression ที่ต่างกัน (เช่นวางทีละพีคแล้วทำ regression หรือตำแหน่งจุดที่วาง) ก็สามารถให้ผลการทำ regression ที่แตกต่างกันได้เช่นกัน ..... จบตอนที่ ๑

วันพฤหัสบดีที่ 8 มีนาคม พ.ศ. 2561

การคำนวณเชิงตัวเลข (๒๐) การปรับเรียบ (Smoothing) ข้อมูล (ตอนที่ ๑) MO Memoir : Thursday 8 March 2561

ใน Memoir ฉบับวันอังคารที่ ๖ มีนาคมที่ผ่านมา (เรื่อง "รู้ทันนักวิจัย (๙) อยากให้มีพีคก็จัดให้ได้") ผมได้เกริ่นเอาไว้ตอนต้นว่า "ชนิดของอัลกอริธึมทางคณิตศาสตร์ที่ใช้ในการปรับแต่งข้อมูลดิบ ก็สามารถตกแต่งการแปลผลว่าจะให้ออกไปในทิศทางไหนก็ได้" มาถึง Memoir ฉบับนี้ก็เลยอยากจะขอยกตัวอย่างบางตัวอย่างให้ดู คือการปรับข้อมูลที่เต็มไปด้วยสัญญาณรวบกวน (Noise) ให้ราบเรียบขึ้น
 
เทคนิคที่เรียบง่ายที่สุดในการปรับข้อมูลให้เรียบขึ้นคือเทคนิคการหาค่าเฉลี่ยเคลื่อนที่ (Moving average) ในเทคนิคนี้จะใช้จุดข้อมูลที่เป็นจำนวนเลขคี่ กล่าวคือสมมุติว่าเราใช้จุดข้อมูล (x0, y0), (x1, y1) และ (x2, y2) ค่าเฉลี่ยปรับแก้ที่จุด x1 (หรือ y1,ave) จะเท่ากับ (y0 + y1 + y2)/3 และในทำนองเดียวกัน ค่าเฉลี่ยปรับแก้ที่จุด x2 (หรือ y2,ave) จะเท่ากับ (y1 + y2 + y3)/3 การปรับเรียบจะทำอย่างนี้ไปเรื่อย ๆ จนกระทั่งถึงจุด (n-1) โดยเราจะสูญเสียค่าที่จุด x0 และ xn ไป
 
ถ้าเราคิดว่าใช้แค่ 3 จุดข้อมูลยังไม่พอ อยากจะใช้มากขึ้น ลำดับถัดไปก็คือการใช้จุดข้อมูล 5 จุด ในที่นี้จะใช้จุดข้อมูล (x0, y0), (x1, y1), (x2, y2), (x3, y3) และ (x4, y4) เพื่อคำนวณหาค่าเฉลี่ยที่จุด x2 (หรือ y2,ave) ซึ่งเท่ากับ (y0 + y1 + y2+ y3 + y4)/5 และในทำนองเดียวกัน ค่าเฉลี่ยปรับแก้ที่จุด x3 (หรือ y3,ave) จะเท่ากับ (y1 + y2 + y3 + y4 + y5)/5 การปรับเรียบจะทำอย่างนี้ไปเรื่อย ๆ จนกระทั่งถึงจุด (n-2) โดยเราจะสูญเสียค่าที่จุด x0, x1, xn-1 และ xn ไป ยิ่งเราใช้จุดในการหาค่าเฉลี่ยแต่ละจุดมากขึ้น เราก็จะยิ่งสูญเสียข้อมูลด้านหัวและท้ายมากขึ้น ตารางที่ ๑ และรูปที่ ๑ แสดงตัวอย่างการเฉลี่ยค่าข้อมูลด้วยการใช้จุดข้อมูลต่าง ๆ กัน

การลดขนาดของสัญญาณรบกวนหรือ noise นั้นทำได้ 2 วิธีการด้วยกัน วิธีการแรกที่ควรต้องทำก่อนและทำออกมาให้ดีที่สุดเท่าที่จะทำได้คือปรับแต่งการวัด ไม่ว่าจะด้วยติดตั้งอุปกรณ์ให้เหมาะสม การเตรียมตัวอย่าง หรือขั้นตอนการวิเคราะห์ ทั้งนี้เพื่อให้ได้ค่าเฉลี่ยของ noise ออกมาให้น้อยที่สุดก่อน จากนั้นจึงค่อยใช้วิธีการที่สองคือการใช้อัลกอริธึมทางคณิตศาสตร์เข้าไปปรับแต่งต่อ เพราะถ้าข้อมูลดิบที่ได้จากการวัดนั้นออกมาไม่ดี ผลการปรับแต่ง (ที่อาจออกมาดูดี) ที่ได้จากการใช้วิธีการทางคณิตศาสตร์ก็สามารถนำไปสู่การแปลผลที่ผิดได้

ตารางที่ ๑ ค่า y คือข้อมูลที่มีสัญญาณรบกวน และนำมาทำการปรับเรียบด้วยการใช้จำนวนจุดต่าง ๆ กัน
x
y
3 pt
5 pt
7 pt
9 pt
0
0.7196841235




0.05
0.7953104631
0.5671218253



0.1
0.1863708893
0.5519866722
0.6385706628


0.15
0.6742786641
0.5592862425
0.6805164395
0.7148009915

0.2
0.8172091742
0.8069669485
0.6977224707
0.702233973
0.7482406044
0.25
0.929413007
0.8759876001
0.7867912918
0.7455958361
0.7332221809
0.3
0.8813406189
0.8141562069
0.8717042599
0.8024740394
0.7284413175
0.35
0.6317149946
0.8706330394
0.8251660875
0.8136174721
0.8075398805
0.4
1.0988435046
0.7716922706
0.7897400247
0.8251958694
0.8268821397
0.45
0.5845183126
0.8118815032
0.793123492
0.8136167251
0.8405333632
0.5
0.7522826926
0.7450196536
0.8364522925
0.8220066633
0.8428139483
0.55
0.8982579557
0.8329665484
0.8046976287
0.8674671316
0.8395755888
0.6
0.8483589968
0.8955623795
0.8777816208
0.8322316858
0.8527556384
0.65
0.9400701859
0.9127891519
0.897764159
0.8559198469
0.8558471708
0.7
0.9499382729
0.9140679475
0.868179656
0.9094033617
0.9187006657
0.75
0.8521953838
0.8508230325
0.9238413159
0.945395049
0.9323417236
0.8
0.7503354407
0.9097327069
0.9658672321
0.9492083656
0.9752135077
0.85
1.1266672961
1.0090675012
0.9508900201
0.9983560552

0.9
1.1501997669
1.0506397587
1.0372717459


0.95
0.8750522131
1.1031186643



1
1.2841040128






รูปที่ ๑ ข้อมูลจากตารางที่ ๑ เมื่อนำมาทำการปรับเรียบข้อมูลด้วยการใช้จำนวนจุดต่าง ๆ กัน

เพื่อให้เห็นภาพจะขอยกตัวอย่างโดยสมมุติว่าได้ทำการวัดค่าสัญญาณ y ในช่วง x ตั้งแต่ 0 ถึง 6 สัญญาณดังกล่าวประกอบด้วยพีคที่มีการกระจายตัวแบบ Gaussian จำนวน 2 พีคด้วยกัน โดยพีคแรกมีศูนย์กลางอยู่ที่ตำแหน่ง x = 2 และแอมพลิจูดเท่ากับ 1.0 พีคที่สองมีศูนย์กลางอยู่ที่ตำแหน่ง x = 4 และแอมพลิจูดเท่ากับ 1.5 กราฟทั้งสองมีค่าครึ่งหนึ่งของความกว้างที่ตำแหน่งครึ่งหนึ่งของความสูงสูงสุดเท่ากับ 1 หน่วย (hwhm - half width at half maximum) กรณีแรกสุดเป็นการจำลองวัดที่กระทำโดยมีช่วงระยะห่างระหว่างจุดข้อมูล Δx = 0.05 กราฟนี้คือเส้น Signal สีน้ำเงินในรูปที่ ๒ (บน)
 
ขั้นตอนต่อไปเป็นการจำลองการใส่ noise เข้าไปค่า signal เพื่อสร้างแบบจำลองค่า signal ที่มี noise รบกวน (เส้น S + N) ด้วยการใช้ฟังก์ชันสุ่มตัวเลขแล้วนำตัวเลขที่สุ่มได้นั้นบวกเข้าไปกับค่า singal การสร้างแบบจำลองสัญญาณที่มี noise รบกวนนี้ทดลองทำ 2 กรณีด้วยกัน โดยกรณีแรกเป็นการจำลองการวัด 2 ครั้ง โดยที่แต่ละจุด x จะให้มี noise ที่เป็นบวก 1 ครั้งและ noise ที่เป็นลบ 1 ครั้ง แล้วนำค่าทั้งสองมาเฉลี่ยเป็นค่า y (เส้น (S + N) ในรูปที่ ๒ (บน)) กรณีที่สองเป็นการจำลองการวัด 10 ครั้ง โดยที่แต่ละจุด x จะให้มี noise ที่เป็นบวก 5 ครั้งและ noise ที่เป็นลบ 5 ครั้ง แล้วนำค่าทั้งสองมาเฉลี่ยเป็นค่า y (เส้น (S + N) ในรูปที่ ๒ (ล่าง))

ถัดไปจะเป็นการทดลองการปรับเรียบข้อมูล (S + N) ด้วยการใช้จุดข้อมูลเฉลี่ย 5, 7 และ 9 จุด (กราฟเส้น 5 pt, 7 pt และ 9 pt ตามลำดับ) ในที่นี้เพื่อให้เห็นภาพผลการปรับเรียบชัดเจนขึ้นจึงได้ทำการเลี่อนกราฟแต่ละเส้นให้สูงขึ้นทีละ 0.5 หน่วย (เพราะถ้าไม่เลื่อนก็จะเห็นมันซ้อนทับกันมั่วไปหมดจนแยกไม่ออก) จากผลการคำนวณจะเห็นว่าเมื่อใช้จำนวนจุดข้อมูลเฉลี่ยมากขึ้น กราฟที่ได้ก็จะมีความเรียบมากขึ้นด้วย 


รูปที่ ๒ เส้นกราฟสีน้ำเงินล่างสุด (Signal) คือค่าสัญญาณที่ไม่มีสัญญาณรบกวน เส้นกราฟสีส้มที่อยู่ถัดไป (S + N) คือสัญญาณที่มีสัญญาณรบกวน (กราฟสีน้ำเงิน + noise) เส้นกราฟ 5pt, 7 pt และ 9 pt ได้จากการนำเอาค่า (S + N) นั้นไปทำการปรับเรียบด้วยการใช้จุดข้อมูล 5, 7 และ 9 จุดตามลำดับ รูปบนเป็นกรณีของการจำลองค่าการวัด 2 ครั้ง ที่การวัดแต่ละครั้งนั้นมี noise รบกวน (ให้เป็น noise ทางบวก 1 ครั้งและ noise ทางลบ 1 ครั้ง) แล้วนำค่าที่วัดได้นั้นมาเฉลี่ย ส่วนรูปร่างเป็นกรณีของการจำลองค่าการวัด 10 ครั้ง ที่การวัดแต่ละครั้งนั้นมี noise รบกวน (ให้เป็น noise ทางบวก 5 ครั้ง) และ noise ทางลบ 5 ครั้ง) แล้วนำค่าที่วัดได้นั้นมาเฉลี่ย จะเห็นว่าเมื่อทำการวัดโดยมีจำนวนครั้งมากขึ้น ขนาดของ noise ที่ปรากฏให้เห็นจะลดลง ในที่นี้แต่ละจุด x ห่างกัน 0.05 หน่วย กราฟแต่ละเส้นมีการขยับขึ้น 0.5 หน่วยเพื่อไม่ให้ซ้อนทับกัน

ส่วนรูปที่ ๓ เป็นการทดลองแบบเดียวกันกับรูปที่ ๒ แต่เป็นการจำลองวัดที่กระทำโดยมีช่วงระยะห่างระหว่างจุดข้อมูล Δx = 0.02 (ละเอียดกว่ารูปที่ ๒) ก็จะเห็นว่าได้ผลทำนองเดียวกัน
  
รูปที่ ๓ เส้นกราฟสีน้ำเงินล่างสุด (Signal) คือค่าสัญญาณที่ไม่มีสัญญาณรบกวน เส้นกราฟสีส้มที่อยู่ถัดไป (S + N) คือสัญญาณที่มีสัญญาณรบกวน (กราฟสีน้ำเงิน + noise) เส้นกราฟ 5pt, 7 pt และ 9 pt ได้จากการนำเอาค่า (S + N) นั้นไปทำการปรับเรียบด้วยการใช้จุดข้อมูล 5, 7 และ 9 จุดตามลำดับ รูปบนเป็นกรณีของการจำลองค่าการวัด 2 ครั้ง ที่การวัดแต่ละครั้งนั้นมี noise รบกวน (ให้เป็น noise ทางบวก 1 ครั้งและ noise ทางลบ 1 ครั้ง) แล้วนำค่าที่วัดได้นั้นมาเฉลี่ย ส่วนรูปร่างเป็นกรณีของการจำลองค่าการวัด 10 ครั้ง ที่การวัดแต่ละครั้งนั้นมี noise รบกวน (ให้เป็น noise ทางบวก 5 ครั้ง) และ noise ทางลบ 5 ครั้ง) แล้วนำค่าที่วัดได้นั้นมาเฉลี่ย จะเห็นว่าเมื่อทำการวัดโดยมีจำนวนครั้งมากขึ้น ขนาดของ noise ที่ปรากฏให้เห็นจะลดลง ในที่นี้แต่ละจุด x ห่างกัน 0.02 หน่วย กราฟแต่ละเส้นมีการขยับขึ้น 0.5 หน่วยเพื่อไม่ให้ซ้อนทับกัน
 
รูปที่ ๔ เป็นการทดลองนำเอาข้อมูลที่ได้จากการปรับเรียบไปทำการแยกพีค (peak deconvolution) ใหม่เพื่อทดสอบว่าผลออกมาจะเป็นอย่างไร การแยกพีคทำด้วยโปรแกรม fityk 0.9.8 (ตัวนี้เป็นซอฟแวร์แจกฟรีครับ) ข้อมูลที่นำไปทดลองแยกพีคประกอบด้วยข้อมูลจุด 9pt ของรูปที่ ๒ (บน) ที่ได้จากการนำเอาสัญญาณเป็นค่าเฉลี่ยจากการวัด 2 ครั้งไปทำการปรับเรียบโดยใช้จุด 9 จุด ผลที่ได้แสดงไว้ในรูปที่ ๔ (บน) และข้อมูลจุด 9pt ของรูปที่ ๒ (ล่าง) ที่ได้จากการนำเอาสัญญาณเป็นค่าเฉลี่ยจากการวัด 10 ครั้งไปทำการปรับเรียบโดยใช้จุด 9 จุด ผลที่ได้แสดงไว้ในรูปที่ ๔ (ล่าง) ในแต่ละรูปนั้น จุดข้อมูลดิบคือจุดสีเขียว (ดูยากหน่อย) เส้นสีแดงคือพีคที่ได้จากการทำ peak deconvolution และเส้นสีเหลืองคือผลรวมของพีคย่อยแต่ละพีค ส่วนเส้นหยักที่อยู่ในกรอบข้างล่างคือค่าความคลาดเคลื่อน (ผลต่างระหว่างจุดข้อมูลจริงและค่าที่ประมาณได้) ณ แต่ละตำแหน่ง x


รูปที่ ๔ การทำ peak deconvolution ด้วยโปรแกรม fityk 0.9.7 (บน) ข้อมูลจุด 9pt ของรูปที่ ๒ (บน) และ (ล่าง) ข้อมูลจุด 9pt ของรูปที่ ๒ (ล่าง) ผลที่ได้ออกมาเป็นอย่างไรก็ขอให้ลองพิจาณากันเอาเองนะครับว่าการได้มาซึ่งข้อมูลที่ถูกต้องนั้นสำคัญอย่างไรในการแปลผล แม้ว่าจะนำเอาคณิตศาสตร์เข้ามาช่วยแล้วก็ตาม
 
เรื่องการแยกพีคหรือการทำ peak deconvolution นี้ ผลที่ได้จะออกมาอย่างไรนั้นยังมีปัจจัยเกี่ยวข้องอีกหลายอย่าง ไม่ว่าจะเป็น จำนวน ขนาด และตำแหน่ง ของพีคเริ่มแรกที่เราเดาขึ้นมาก่อนให้อัลกอริธึมทำการปรับแต่งเพื่อให้ได้ค่าความคลาดเคลื่อนต่ำสุด หรือจะกล่าวจะว่า "อยากให้มีสักกี่พีค ที่ตำแหน่งไหนบ้าง ก็จัดให้ได้" ก็ไม่น่าจะผิดจากความเป็นจริงไปมากนั้น


วันจันทร์ที่ 16 กุมภาพันธ์ พ.ศ. 2558

เก็บตกจากการประชุมวิชาการ ๒๕๕๗ ตอนที่ ๑ MO Memoir : Monday 16 February 2558

เนื้อหาใน Memoir ฉบับนี้นำลง blog เพียงบางส่วน

เมื่อประมาณกลางเดือนธันวาคมที่ผ่านมา ได้มีโอกาสไปเข้าร่วมประชุมวิชาการ ณ จังหวัดเชียงใหม่ ที่มีผู้มาเข้าร่วมประชุมจากมหาวิทยาลัยต่าง ๆ เต็มไปหมด แต่ด้วยข้อจำกัดของเวลาทำให้เข้าฟังการบรรยายได้เฉพาะบางห้องเท่านั้น และแม้แต่ในห้องที่เข้าฟังเอง เมื่อเห็นการแปลผลการทดลองที่คิดว่าน่าสงสัยอยู่ก็ไม่มีโอกาสที่จะได้ทักท้วง มาคราวนี้เลยขอเลือกเอาบางผลการทดลองมาเล่าสู่กันฟัง เพื่อเป็นตัวอย่างข้อควรระวังในการแปลผล 

. การทำ peak fitting ของ CO2-TPD

การทำ CO2-TPD (CO2 Temperature Programmed Desorption) เริ่มจากการให้ตัวอย่างที่เป็นของแข็ง (ปรกติก็เป็นผง) ดูดซับแก๊สคาร์บอนไดออกไซด์ (CO2) เอาไว้จนอิ่มตัวที่อุณหภูมิหนึ่ง (มักจะเป็นอุณหภูมิห้อง) จากนั้นก็ค่อย ๆ เพิ่มอุณหภูมิตัวอย่างด้วยอัตราที่กำหนด แล้วทำการตรวจวัดปริมาณ CO2 ที่ตัวอย่างคายซับออกมาที่อุณหภูมิต่าง ๆ กัน เทคนิคนี้มีการนำไปใช้ในการวัดความแรงของตำแหน่งที่เป็นเบสบนพื้นผิวของแข็ง และความสามารถในการจับ CO2 ในกรณีที่ปฏิกิริยาที่ศึกษานั้นมี CO2 เป็นสารตั้งต้น
  
วิธีการทำ CO2-TPD ก็ใช้อุปกรณ์เดียวกันกับที่ใช้ทำ NH3-TPD เพียงแต่เปลี่ยนชนิดของแก๊สที่ใช้ในการดูดซับ การวัดปริมาณ CO2 ที่ตัวอย่างคายซับออกมานั้นจะใช้ตัวตรวจวัดชนิด Thermal Conductivity Detector (TCD) 
  
ตัวอย่างที่นำมาแสดงในรูปที่ ๑ มีคำอธิบายว่า “แสดงโปรไฟล์การคายซับของก๊าซคาร์บอนไดออกไซด์ (CO2-TPD) บนตัวเร่งปฏิกิริยาคอปเปอร์เซอร์โคเนียที่มีเฟสแตกต่างกัน โดยโปรไฟล์ CO2-TPD ของตัวเร่งปฏิกิริยาดังกล่าวสามารถจำแนกออกเป็นพีคย่อยๆ ได้ 3 พีค คือ alpha beta และ gamma ซึ่งเป็นตัวแทนของ weak medium และ strong basic site จากรูปจะสังเกตเห็นว่า แม้โปรไฟล์ CO2-TPD ของตัวเร่งปฏิกิริยาทั้งสามมีลักษณะที่เหมือนกัน แต่อุณหภูมิในการคายซับของก๊าซคาร์บอนไดออกไซด์ในแต่ละ basic site ของทั้ง 3 ตัวเร่งปฏิกิริยามีการเลื่อนตำแหน่งที่ไม่ตรงกัน ซึ่งชี้ให้เห็นว่าเฟสของเซอร์โคเนียมีผลต่อความแรงของแต่ละ basic site บนตัวเร่งปฏิกิริยาคอปเปอร์เซอร์โคเนีย นั่นหมายความความแข็งแรงในการยึดเหนี่ยวของก๊าซคาร์บอนไดออกไซด์ที่ดูดซับบนตัวเร่งปฏิกิริยาก็จะแตกต่างกันออกไป โดยพบว่าตัวเร่งปฏิกิริยา Cu/m-ZrO2 มีอุณหภูมิในการคายซับก๊าซคาร์บอนไดออกไซด์ในแต่ละ basic site สูงที่สุด ซึ่งแสดงให้ว่าก๊าซคาร์บอนไดออกไซด์ที่ดูดซับบนพื้นผิวตัวเร่งปฏิกิริยา Cu/m-ZrO2 มีการยึดเหนี่ยวกันที่แข็งแรงมาก ในขณะที่ก๊าซคาร์บอนไดออกไซด์ที่ดูดซับบนพื้นผิวตัวเร่งปฏิกิริยา Cu/t-ZrO2 มีการยึดเหนี่ยวกันที่ไม่แข็งแรงมากนัก ซึ่งจะเห็นจากอุณหภูมิในการคายซับของก๊าซคาร์บอนไดออกไซด์เกิดขึ้นที่อุณหภูมิต่ำ
  
ผลตรงนี้ในส่วนของผมเองมีประเด็นที่ตั้งข้อสังเกตหลายประเด็น อย่างแรกก็คือเป็นเรื่องปรกติที่พีคการคายซับ (desorption peak) จะเป็นพีคที่ไม่สมมาตร อันเป็นผลเนื่องจากการแพร่ออกมาจากรูพรุนของตัวอย่าง (ดู Memoir ปีที่ ๖ ฉบับที่ ๗๔๔ วันศุกร์ที่ ๗ กุมภาพันธ์ ๒๕๕๗ เรื่อง “ทำไมพีคจึงลากหาง”) ดังนั้นการทำ peak fitting จึงควรใช้ฟังก์ชันพีค Gaussian ที่ไม่สมมาตร (ดู Memoir ปีที่ ๓ ฉบับที่ ๓๑๔ วันศุกร์ที่ ๑๐ มิถุนายน ๒๕๕๔ เรื่อง “GC- peak fitting ตอนที่๑ การหาพื้นที่พีคที่เหลื่อมทับ”)
  
ในรูปที่ ๑ นั้นคณะผู้วิจัยพยายามแปลผลด้วยการใช้ฟังก์ชัน Gaussian ที่สมมาตรในการแยกหาตำแหน่งพีค จะเห็นว่าการทำ peak fitting ดังกล่าวไม่สามารถปรับเข้ากับผลการทดลองได้ดี โดยเฉพาะตรงบริเวณที่ลูกศรสีส้มชี้ที่เห็นได้ชัดว่าผลรวมของพีคย่อย (เส้นประนั้น) แตกต่างไปจากผลการทดลอง (เส้นทึบ) อย่างเห็นได้ชัด นอกจากนี้ตรงส่วนหน้าของพีคแรก (ที่ประมาณ 70ºC) ตรงลูกศรสีเขียวชี้ การทำ curve fitting ก็ยังทำได้ไม่ดี จะเห็นว่ารูปร่างความโค้งของเส้นข้อมูลผลการทดลองและความโค้งของพีค Gaussian นั้นแตกต่างกันอยู่ ทั้งนี้อาจเป็นผลการการกำหนดแนว base line ของข้อมูล
  
รูปที่ ๑ CO2-TPD profiles 
  
. อุณหภูมิและการดูดซับ

การดูดซับโมเลกุลบนพื้นผิวของแข็งนั้นเป็นปฏิกิริยาคายความร้อน (ดู Memoir ปีที่ ๔ ฉบับที่ ๓๗๕ วันพุธที่ ๑๔ ธันวาคม ๒๕๕๔ เรื่อง “อุณหภูมิและการดูดซับ”) ดังนั้นเมื่ออุณหภูมิสูงขึ้น การดูดซับจะเกิดขึ้นน้อยลง ตัวอย่างที่เห็นได้ชัดได้แก่สารดูดความชื้นต่าง ๆ เมื่อสารเหล่านี้ดูดความชื้นจนอิ่มตัว เราก็สามารถไล่ความชื้นที่มันดูดซับเอาไว้ได้ด้วยการให้ความร้อนแก่สารดูดซับเหล่านั้นที่อุณหภูมิที่สูงพอ ความชื้นที่สารดูดซับจับเอาไว้ก็จะหลุดออกไป
  
รูปที่ ๒ เป็นผลการทดลองการดูดซับสีย้อมชนิดหนึ่งในน้ำที่อุณหภูมิต่าง ๆ กัน ซึ่งมีคำอธิบายว่า “พบว่าในช่วง 2 นาทีแรก ความสามารถในการดูดซับเกิดอย่างรวดเร็ว มีค่า 66,700, 66,111 และ 66,407 ppm ของคองโกเรดต่อกรัมของตัวดูดซับ ตามลําดับ หลังจากนั้นความสามารถในการดูดซับสารละลายคองโกเรดเริ่มลดลงและเข้าสู่สมดุล ซึ่งเกิดขึ้นในเวลาประมาณ 60 นาที มีความสามารถในการดูดซับสารละลายคองโกเรดเท่ากับ 68,658 , 68,976 และ 69,529 ppm ของคองโกเรดต่อกรัมของตัวดูดซับ ตามลําดับ ความสามารถในการดูดซับสารละลายคองโกเรดเกิดขึ้นได้มากที่อุณหภูมิสูง เนื่องจากพลังงานจลน์ของสารละลายคองโกเรดมีปริมาณมาก ในขณะที่มีการเพิ่มอุณหภูมิจะทําให้เกิดการเคลื่อนที่ของสารละลายคองโกเรดได้มากขึ้น พลังงานจลน์ของสารละลายคองโกเรดมีค่ามากกว่าพลังงานศักย์ จึงเกิดแรงดึงดูดระหว่างตัวดูดซับกับสารละลายคองโกเรด” ซึ่งผลตรงนี้ขัดกับสิ่งที่ทฤษฏีทำนายไว้ ที่กล่าวไว้ในย่อหน้าข้างบน
  
รูปที่ ๒ ผลของอุณหภูมิต่อความสามารถในการดูดซับสีคองโกเรด (congo red) ความเข้มข้น 700 ppm ที่เวลาต่าง ๆ กัน ใช้ตัวดูดซับคาร์บอนกัมมันต์ที่เตรียมจากแบคทีเรียลเซลลูโลสที่ไม่ผ่านการแช่ด้วยกรด ปริมาณ 0.2 กรัม เปลี่ยนแปลงอุณหภูมิของสารละลายคองโกเรดเป็น 30, 45 และ 60 ºC 

ปรกติของแข็งที่มีรูพรุนนั้นเมื่ออยู่ในเฟสแก๊สก็จะมีเฟสแก๊สแทรกอยู่ในรูพรุน เมื่อเรานำไปใช้ในการดูดซับสารออกจากเฟสแก๊ส เฟสแก๊สที่อยู่นอกรูพรุนและเฟสแก๊สที่อยู่ในรูพรุนจะมีความต่อเนื่องกัน โมเลกุลสารที่ต้องการดูดซับจะสามารถแพร่จากเฟสแก๊สที่อยู่นอกรูพรุนเข้าไปในรูพรุนได้ และลงไปเกาะบนพื้นผิวของแข็งได้ แต่กรณีของการนำเอาของแข็งมีรูพรุน ซึ่งเดิมอยู่ในเฟสแก๊ส แล้วใส่ลงไปในเฟสของเหลวนั้นแตกต่างออกไป เพราะเฟสของเหลวที่อยู่นอกรูพรุนจะไม่สามารถแพร่เข้ามาในรูพรุนได้เพราะมีเฟสแก๊สขวางกั้นอยู่ ที่อุณหภูมิต่ำพื้นที่จำนวนมากของรูพรุนถูกปกคลุมเอาไว้ด้วยเฟสแก๊ส ทำให้ไม่สามารถใช้พื้นที่เหล่านั้นในการดูดซับโมเลกุลที่อยู่ในเฟสของเหลวได้ แต่เมื่อเพิ่มอุณหภูมิให้สูงขึ้น แก๊สจะขยายตัวแพร่ออกมาจากรูพรุนมากขึ้น ของเหลวจะแทรกเข้าไปในรูพรุนได้ง่ายขึ้น (ความหนืดลดลง) พื้นที่ของรูพรุนที่ถูกปกคลุมด้วยของเหลวก็มากขึ้นตามไปด้วย ทำให้เห็นความสามารถในการดูดซับดีขึ้นที่อุณหภูมิที่สูงขึ้น
 
วิธีการที่ดีกว่าและเหมาะสมกว่าในการใช้ของแข็งมีรูพรุนทำปฏิกิริยาในเฟสของเหลวคือหาทางเติมของเหลวให้เต็มรูพรุนต่าง ๆ ก่อนที่จะเริ่มทำการทดลอง วิธีการหนึ่งที่สามารถทำได้ก็คือการนำเอาของแข็งนั้นไปต้มในสารละลายที่ใช้ในการศึกษาก่อนที่จะใส่สารตั้งต้นลงไปในสารละลาย

. การทำ Linear regression

การทำ regression เป็นการหาความสัมพันธ์ระหว่างตัวแปรอิสระ (x ซึ่งอาจมีมากกว่า ๑ ตัวแปร) กับตัวแปรตาม (y ซึ่งมีเพียงตัวเดียว) การทำ regression แตกต่างจากการทำ curve fitting ตรงที่ในการทำ curve fitting นั้นเราหาฟังก์ชันที่ “ต้องผ่าน” จุดข้อมูลที่มีอยู่ทุกจุด (ปรกติที่ x ค่าหนึ่งจะมี y เพียงค่าเดียว) ในขณะที่การทำ regression นั้นเป็นการหาฟังก์ชันที่เมื่อลากผ่านกลุ่มจุดข้อมูลที่มีอยู่ (ไม่จำเป็นต้องผ่านจุดใดจุดหนึ่งเลยก็ได้) แล้วให้รูปเส้นกราฟกับการกระจายตัวของจุดข้อมูลนั้นออกมา “ดูดี” ที่สุด คำว่า “ดูดี” ในที่นี้มักหมายถึง “ความคลาดเคลื่อน” หรือ “error” นั้นน้อยที่สุด
 
ในการทำ regression นั้นเราจำเป็นต้องกำหนดฟังก์ชันสำหรับการลากเส้นขึ้นมาก่อน จากนั้นจึงค่อยหาว่าค่าพารามิเตอร์ต่าง ๆ ของฟังก์ชันนั้นควรมีค่าเป็นเท่าใดจึงจะให้เส้นกราฟที่ได้นั้นสอดคล้องกับรูปแบบการเปลี่ยนแปลงข้อมูล ตัวอย่างเช่นในกรณีของการเลือกใช้สมการเส้นตรง พารามิเตอร์ที่ต้องหาคือค่าความชันและจุดตัดแกน x
 
“ความคลาดเคลื่อน” คือระยะห่างระหว่างจุดข้อมูลกับเส้นกราฟที่ได้ ส่วนจะวัดในรูปแบบไหนก็ขึ้นอยู่กับว่าเรามั่นใจในจุดข้อมูล x และ y มากน้อยเพียงใด (ดูรูปที่ ๓ ประกอบ)  ถ้าเรามั่นใจว่าค่า x ของเราถูกต้อง ส่วนค่า y นั้นอาจมีความคลาดเคลื่อนได้ ระยะห่างก็จะวัดในแนวแกน y (ในกรณีนี้ข้อมูลมีการกระจายตัวเฉพาะในทิศทางแกนy กล่าวคือที่ x ค่าหนึ่งมี y ได้หลายค่า) ในทางกลับกันถ้าเรามั่นใจว่าค่า y ของเราถูกต้อง ส่วนค่า x นั้นอาจมีความคลาดเคลื่อนได้ ระยะห่างก็จะวัดในแนวแกน x (ในกรณีนี้ข้อมูลมีการกระจายตัวในทิศทางแกน x กล่าวคือที่ y ค่าหนึ่งมี x ได้หลายค่า) และถ้าเราสงสัยว่าข้อมูลทั้ง x และ y มีความคลาดเคลื่อนทั้งคู่ ระยะห่างก็จะวัดในแนวที่เส้นที่ลากจากจุดนั้นไปตั้งฉากกับเส้นกราฟที่ได้ (ข้อมูลมีการกระจายตัวทั้งในทิศทางการแ x และแกน y) เมื่อกำหนดแนวที่จะทำการวัดความคลาดเคลื่อนได้แล้ว ต่อไปก็จะเป็นขั้นตอนการหาวิธีการที่จะให้เส้นกราฟออกมา “ดูดี” ที่สุด ซึ่งวิธีทั่วไปที่ใช้กันก็คือแนวเส้นที่ทำให้ค่าผลรวมของระยะห่างของแต่ละจุดข้อมูลกับเส้นกราฟนั้นมีค่าน้อยที่สุด

รูปที่ ๓  การวัดระยะความคลาดเคลื่อน (ซ้าย) ถ้าความคลาดเคลื่อนมีเฉพาะในทิศทางแกน y  (กลาง) ถ้าความคลาดเคลื่อนมีเฉพาะในทิศทางแกน x และ (ขวา) ถ้าความคลาดเคลื่อนมีทั้งในทิศทางแกน x และแกน y
 
การทำ regression ที่พบมากที่สุดเห็นจะได้แก่การทำ linear regression ที่ใช้ความสำคัญกับจุดข้อมูลทุกจุดเท่ากันหมด แต่การทำ linear regression จะเหมาะสมก็ต่อเมื่อรูปแบบการกระจายตัวของข้อมูลนั้นดูแล้วมีแนวโน้มว่าจะมีการเปลี่ยนแปลงในแนวเส้นตรง กล่าวคือควรมีจำนวนจุดข้อมูลที่ค่า x มากกว่าสองตำแหน่ง และการกระจายตัวของข้อมูลที่แต่ละตำแหน่ง x นั้นไม่ควรมากเกินไป (ถ้ามากเกินไปแสดงว่าวิธีการวัดมีปัญหา และอาจต้องพิจารณาตัดจุดข้อมูลที่กระจายตัวหลุดออกจากกลุ่มใหญ่ออกไป) ควรให้ความสำคัญกับข้อมูลการกระจายตัวที่เกาะกลุ่มกันมากกว่าที่หลุดกลุ่มออกไป



รูปที่ ๔ การทำ linear regression ด้วยการทดลองใช้แบบจำลองแตกต่างกัน 3 รูปแบบ (บทความเดียวกับรูปที่ ๒) กับจุดข้อมูล 5 ที่สองตำแหน่งตัวแปร x
 
กราฟในรูปที่ ๔ มาจากความพยายามที่จะทำ linear regression กับข้อมูล 5 จุด โดยใช้แบบจำลอง 3 รูปแบบ โดยข้อมูล 4 จุดนั้นเป็นของตำแหน่ง x ตำแหน่งหนึ่ง และอีก 1 จุดนั้นเป็นของตำแหน่ง x อีกตำแหน่งหนึ่ง ประเด็นที่อยากจะให้ลองพิจารณาตรงนี้คือจำนวนข้อมูลที่มีนั้นเหมาะสมที่จะทำ linear regression หรือยัง และถ้าตัดเข้าข้อมูลออกไป 1 จุด (ที่วงกลมสีแดงเอาไว้ในแต่ละรูป ซึ่งเป็นข้อมูลตัวเดียวกัน เพียงแต่นำไปใส่ในฟังก์ชันแตกต่างกันเท่านั้นเอง) ผลการทำ linear regression จะออกมาเป็นอย่างไร (ลองพิจารณาเฉพาะแค่ความชันของเส้นที่จะได้ก่อนก็ได้)

ตอนที่ ๑ ของเรื่องนี้คงต้องขอจบแค่นี้ก่อน ไม่งั้นเนื้อหาจะยาวเกินไป ส่วนตอนที่ ๒ จะออกมาภายในเดือนนี้ แต่ต้องขอใช้เวลาย่อยสักนิด